梁文锋论文登上《自然》封面
创始人
2025-09-18 20:42:12
0

据科技日报消息,9月17日,DeepSeek-AI团队梁文锋及其同事在《自然》杂志上发表了开源人工智能(AI)模型DeepSeek-R1所采用的大规模推理模型训练方法。

另据第一财经报道,与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。

DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价道: 目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”

梁文锋 资料图 同意:视觉中国

DeepSeek-R1包含一个在人类监督下的深入训练阶段,以优化推理过程。梁文锋团队报告称,该模型使用了强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。

DeepSeek-R1在被展示优质的问题解决案例后,会获得一个模板来产生推理过程,即这一模型通过解决问题获得奖励,从而强化学习效果。团队总结说,未来研究可以聚焦优化奖励过程,以确保推理和任务结果更可靠。

梁文锋出生于1985年,广东湛江人,幻方量化、DeepSeek创始人。2024年12月,梁文锋和团队开发的大模型“DeepSeek-V3”发布。2025年4月,梁文锋入选美国《时代》周刊“2025年全球最具影响力100人”榜单。

DeepSeek是2023年成立于杭州的人工智能公司,由幻方量化孵化。创始团队由梁文锋领衔,成员来自顶尖高校与国际机构技术专家。

相关内容

热门资讯

Meta被曝开发智能眼镜人脸识... 据雷科技报道,2月14日有外媒披露,Meta正在重新评估为其智能眼镜加入人脸识别功能,最快可能在今年...
中移申请访问控制方法专利,提高... 国家知识产权局信息显示,中移(成都)信息通信科技有限公司、中国移动通信集团有限公司申请一项名为“访问...
《自然》重磅:迄今为止最大的量... 自 20 世纪初量子力学诞生以来,人类对于世界的认知便被撕裂成了两半:微观世界遵循着概率云与叠加态的...
找准央企发展AI定位 更大力度... 人民网北京2月14日电 (记者黄盛)“切实当好智算基础设施的供给者、人工智能赋能千行百业的推动者、产...
东西问丨DeepSeek不爱人... 中新网北京2月14日电(记者 贺劭清 韩禹)近日,国产AI助手深度求索(DeepSeek)因技术升级...
独家|周鸿祎谈Seedance... 提到最近AI圈最火爆的热词,莫过于字节跳动旗下最新视频大模型Seedance. 2月12日,字节跳动...
【新春走基层】这场在济宁举办的... 齐鲁晚报·齐鲁壹点 孔茜 张清直 济宁报道 当2500架无人机携着微光升腾天际,如万千萤火虫点亮深邃...
【窥一斑而知全豹】氩氦刀消融:... 窥一斑而知全豹。一项高精尖技术能否真正落地临床,实现常规化、普遍化、常态化开展,最能体现一家医院的技...
核光钟最后一个核心瓶颈攻克 记者12日从清华大学获悉,该校副教授、北京量子信息科学研究院兼聘研究员丁世谦团队攻克了核光钟研制的“...
(新春见闻)科技融入生活 AI... 中新社长沙2月14日电 (记者 唐小晴)春节前夕,在湖南长沙县一家机器人9S店内,具备按摩、助浴、搬...