梁文锋论文登上《自然》封面,正面回应DeepSeek-R1蒸馏质疑

youaiyouxia2025-09-18 10:37:28TechWeb.com.cn

9月17日消息,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。《自然》杂志还公布了同行评审报告,DeepSeek-R1也成为全球首个经过同行评审的主流大语言模型。

发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异,披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。

DeepSeek-R1发布之初,曾有传闻称该模型使用了OpenAI的模型进行蒸馏。在同行评审文件中,DeepSeek介绍,DeepSeek-R1的基座模型DeepSeek-V3 Base使用的数据全部来自互联网,可能包含GPT-4生成的结果,但绝非有意而为之,DeepSeek-V3-Base并没有引入在合成数据集上进行大规模监督蒸馏的“冷却”阶段。

DeepSeek-V3-Base的数据截止时间为2024年7月,当时尚未发布任何公开的先进推理模型,这进一步降低了从现有推理模型中无意蒸馏的可能性。

DeepSeek为DeepSeek-R1新增了一份全面的安全报告,对DeepSeek-R1的安全性进行了全面评估,证明其安全性领先同期发布的前沿模型。

报告提到,DeepSeek-R1在服务部署中引入了外部风险控制系统,不仅可以基于关键词匹配识别不安全对话,还使用DeepSeek-V3直接进行风险审查,判断是否应拒绝响应。DeepSeek建议开发者在使用DeepSeek-R1时,部署类似的风险控制系统。

在公开安全基准测试和内部安全研究中,DeepSeek-R1在大多数基准上超过了Claude-3.7-Sonnet、GPT-4o等前沿模型。开源部署版本的安全性虽不及具备外部风险控制系统的版本,但仍拥有中等水平的安全保障。

《自然》杂志评价道:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”。随着AI技术日渐普及,大模型厂商们无法验证的宣传可能对社会带来真实风险。依靠独立研究人员进行的同行评审,是抑制AI行业过度炒作的一种有效方式。(宜月)

OpenAI“私人秘书”Operator 现身 ChatGPT App 代码,订阅用户有望抢先体验

IT之家1月23日消息,OpenAI的全新AI功能“Operator”有望很快到来,外媒TechCrunch今日报道称,ChatGPT代码库的最新更新显示,Operator将作为早期研究预览版本提供给200美元(IT之家备注:当前约1455元人民币)Pro订...

消息称苹果正研发一款桌面机器人 计划2027年推出

8月14日消息,据外媒报道,苹果正研发一款可以放置在桌面的机器人,计划于2027年推出。这款设备配备一块7英寸大小的类iPad显示屏,安装在一个可活动的机械臂上,可以旋转至任意方向,从而根据说话人的位置自动调整方...

百川智能CEO王小川:聚焦AI医疗,减少多余动作,减小组织复杂度

4月10日消息,今日,百川智能公开了公司CEO王小川的全员信。王小川反思了既往的不足。他表示,两年的战线拉得过长,不够聚焦。借两年庆之机,对百川的每一位同事讲解我们的愿景和业务方向。王小川强调:为生命建模型...

消息称苹果 iOS 18 系统因用户隐私处理问题,无法保证提供生成式 AI 服务

IT之家3月25日消息,马克・古尔曼(MarkGurman)表示,苹果公司将在今年的开发者大会上发布iOS18系统,届时将介绍如何看待和整合AI技术。古尔曼表示,当苹果在WWDC2024上宣布iOS18时,预计将花费大量时间讨论如何看...

AI芯片供不应求,消息称台积电今明两年先进封装产能已被英伟达、AMD包下

5月6日消息,台媒《经济日报》消息,英伟达、AMD两家公司重视高性能计算(HPC)市场,包下台积电今明两年CoWoS与SoIC先进封装产能。台积电对AI相关应用的发展前景充满信心,总裁魏哲家在4月份的财报会议上调整了AI订...

上一篇:斗战者天禧智能体眼镜G1101评测:轻装上阵的AI穿戴新体验
下一篇:IDC:2025年上半年公有云大模型调用量,火山引擎市场份额近半