梁文锋论文登上《自然》封面
创始人
2025-09-18 20:42:12
0

据科技日报消息,9月17日,DeepSeek-AI团队梁文锋及其同事在《自然》杂志上发表了开源人工智能(AI)模型DeepSeek-R1所采用的大规模推理模型训练方法。

另据第一财经报道,与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。

DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价道: 目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”

梁文锋 资料图 同意:视觉中国

DeepSeek-R1包含一个在人类监督下的深入训练阶段,以优化推理过程。梁文锋团队报告称,该模型使用了强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。

DeepSeek-R1在被展示优质的问题解决案例后,会获得一个模板来产生推理过程,即这一模型通过解决问题获得奖励,从而强化学习效果。团队总结说,未来研究可以聚焦优化奖励过程,以确保推理和任务结果更可靠。

梁文锋出生于1985年,广东湛江人,幻方量化、DeepSeek创始人。2024年12月,梁文锋和团队开发的大模型“DeepSeek-V3”发布。2025年4月,梁文锋入选美国《时代》周刊“2025年全球最具影响力100人”榜单。

DeepSeek是2023年成立于杭州的人工智能公司,由幻方量化孵化。创始团队由梁文锋领衔,成员来自顶尖高校与国际机构技术专家。

相关内容

热门资讯

什么是主数据?2025年主数据... 导语:在数字化转型和智能化升级的背景下,主数据已经成为企业上云、上 AI 的第一道关口。客户、产品、...
七分钟攻略!聚游广东麻将有挂吗... 1、七分钟攻略!聚游广东麻将有挂吗,wepoke最新下载地址(详细透视辅助脚本教程)。2、聚游广东麻...
9分钟了解!老友潮汕麻将有挂吗... 9分钟了解!老友潮汕麻将有挂吗,红龙扑克有挂(详细透视辅助工具教程)1、每一步都需要思考,不同水平的...
1分钟总结!雀友游戏辅助,德州... 1分钟总结!雀友游戏辅助,德州之星辅助器哪里买(详细透视辅助黑科技教程);亲,其实确实真的有挂(需添...
2分钟教程!乐酷大厅有挂吗,p... 2分钟教程!乐酷大厅有挂吗,poker辅助工具(详细透视辅助神器教程);亲真的是有正版授权,小编(透...
7分钟详情!贵阳手机天天麻将a... 7分钟详情!贵阳手机天天麻将app辅牌器购买,德州辅助分析软件(详细透视辅助插件教程);亲们利用一分...
7分钟详情!微友辅助器ios免... 7分钟详情!微友辅助器ios免费版,wpk使用ai辅助会封号(详细透视辅助器教程)关于微友辅助器io...
7分钟黑科技!科乐长乐麻将如何... 7分钟黑科技!科乐长乐麻将如何提高胜率,wepoke软件机器人(详细透视辅助神器教程);玩家必备必赢...
七分钟介绍!闲玩暗宝可以买软件... 七分钟介绍!闲玩暗宝可以买软件吗,aapoker俱乐部(详细透视辅助app教程);致您一封信;亲爱闲...
4分钟总结!广西老友玩游戏辅助... 相信很多朋友都在电脑上玩过广西老友玩游戏辅助器吧,但是很多朋友都在抱怨用电脑玩起来不方便。为此小编给...