外界热议DeepSeek低调“上新”
创始人
2025-03-26 09:40:35
0

本报记者 刘 扬

中国人工智能初创公司深度求索(DeepSeek)24日深夜低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著提升,甚至代码能力追平美国Anthropic公司大模型Claude 3.7。不过,外界对于DeepSeek-V3-0324的关注并不仅仅因为该版本的能力提升,而是猜测它的发布是否意味着DeepSeek更新一代的V4与R2大模型的发布不远了。

在回答《环球时报》记者有关DeepSeek-V3新版本有哪些能力提升时,DeepSeek表示,一是新版本代码能力显著提升,接近Claude 3.7水平。例如,有用户在实测中发现,V3-0324能一次性生成800行无错误的网页代码,并实现动态响应式布局和交互效果。二是数学与逻辑推理能力增强。例如经典的“4升水壶问题”和数学竞赛题(如AIME 2025题目),部分表现接近专业推理模型。三是模型架构与开源生态。V3-0324采用MIT许可证,允许自由修改、分发及商业化应用,进一步降低了开发者的使用门槛。

清华大学新闻学院人工智能学院教授沈阳25日对《环球时报》记者表示,DeepSeek-V3-0324不仅是V3系列的一次迭代,更是中国AI技术崛起的又一力证。其在性能、效率和开源策略上的综合优势使其在全球大语言模型领域占据重要地位。未来,DeepSeek可能通过推理能力提升和多模态扩展来巩固技术领先优势,同时在中美竞争和社区生态中寻找平衡。沈阳认为,DeepSeek-V3-0324的发布看似是一次“小更新”,但其性能跳跃表明该团队可能在为后续重大版本(如传言中的DeepSeek-R2或V4)铺路。

路透社今年2月底引述3名知情人士的说法宣称,DeepSeek原计划在今年5月初发布R2,但现在希望尽早推出,具体时间尚未透露。此外,DeepSeek希望新模型在代码生成和多语言推理方面的表现进一步提升。不过,外媒的相关传言并没有得到DeepSeek公司的证实与回应。

沈阳表示,DeepSeek-V3-0324的推出进一步凸显中国AI企业在技术与成本上的竞争力。美国对华GPU出口限制可能促使中国企业加速国产硬件适配,同时其开源模式或引发西方厂商的连锁动作,例如推出更强闭源模型。2025年可能是中美AI竞争的分水岭。

沈阳认为,在OpenAI公司的GPT大模型要把通用大模型和推理大模型融合在一起的背景下,外界关注包括DeepSeek在内的中国头部大模型是不是最终也会出现这种合并的趋势。“这种可能是存在的,因为对于用户来说,并不关心大模型在回应自身问题时用的是什么类型的模型,更关心大模型能不能给出更为智能、合理的参考答案。”

相关内容

热门资讯

地球生命起源有新解 或诞生于水... 王信强 斯坦福大学的一项研究显示,生命可能起源于水滴中的“微闪电”。也就是说,构成地球生命的第一个分...
优刻得与数道智算达成智算中心战... 近日,优刻得与智能计算领域创新企业北京数道智算科技有限公司(下称:数道智算)正式签署战略合作协议,双...
游戏ios系统管理:便宜好用且... **一、云手机在游戏群控管理中的重要性** 在当今的游戏世界里,特别是对于那些需要多账号操作或者...
局域网监控软件哪家好?5款高端... 你是否遇到过这样的烦恼: 公司网络突然变慢,却找不到原因? 员工上班时间刷视频、打游戏,工作效率低下...
西湖大学开发出精准定位脑疾病细... 2025-03-20 08:41:52 作者:狼叫兽 近日,西湖大学杨剑教授团队在脑疾病研究领域...
时隔两月半,微信内测爆更! 在多个新功能灰度放量后,微信官方终于发布了新版本更新。 就在昨晚(3 月 10 日), 微信安卓平台...
学而思“上新”,学习机的“参数... 来源:雪豹财经社 在小红书上,“学习机哪个牌子好用推荐”的相关笔记超过130万篇。面对市面上大量同质...
新科技成果!创新草莓原种苗技术... 近日,在第十届世界草莓大会上,上海交通大学农生物学院研究员许文平团队研发的“纯品种、减农药、减化肥”...
化学清洗技术与清洗剂2025武... 2025武汉工业清洗展:引领技术革新的新纪元 多元清洗技术大汇聚:武汉展会即将开启 化学清洗技术与清...
苹果Siri陷尴尬:14年后仍... 近期,科技界热议的一则消息引起了广泛关注:苹果公司的智能助手Siri,在面世14年后,竟然无法准确回...