万亿参数旗舰模型Ling-1T正式发布并开源
创始人
2025-10-10 10:22:34
0

封面新闻记者 张越熙

10月9日,蚂蚁集团发布万亿参数的通用语言模型 Ling-1T。Ling-1T是蚂蚁百灵大模型Ling 2.0 系列的第一款旗舰模型,也是蚂蚁百灵团队迄今为止推出的规模最大、能力最强的非思考大模型。测评显示,在有限输出 Token 条件下,Ling-1T于多项复杂推理基准中取得 SOTA 表现。

以竞赛数学榜单 AIME 25 (American Invitation Math Examination 25)为例,Ling-1T以平均4000+ Token的消耗达到了70.42%的准确率,优于Gemini-2.5-Pro(平均5000+ Token,准确率70.10%)。

据透露,Ling-1T 沿用 Ling 2.0 架构,在 20T+ tokens 高质量、高推理浓度的语料上完成预训练,支持最高 128K 上下文窗口,通过“中训练+后训练”的演进式思维链(Evo-CoT)极大提升模型高效思考和精准推理能力。

除此之外,Ling-1T 全程采用 FP8 混合精度训练(部分技术已开源),是目前已知规模最大的使用 FP8 训练的基座模型。这一设计为训练带来了显著的显存节省、更灵活的并行切分策略和 15%+ 的端到端加速。

在强化学习阶段,百灵团队提出了LPO方法(Linguistics-Unit Policy Optimization,LingPO) ,这是一种以“句子”为粒度的策略优化算法,为万亿参数模型的稳定训练提供了关键支持。这种方法既避免了词元级别的破碎感,也克服了序列级别的笼统性,使得奖励信号与模型行为在语义层面实现了更精准地对齐。

记者了解到,除了Ling-1T这款非思考模型,蚂蚁百灵团队还在训练万亿参数级的深度思考大模型Ring-1T,已在9月30日开源了preview版。

相关内容

热门资讯

第4分钟了解(德扑手牌)软件透... 第4分钟了解(德扑手牌)软件透明挂辅助科技(透视)德州教程(2020已更新)(哔哩哔哩)是一款可以让...
第7分钟了解(德扑之星带入)外... 您好:德扑之星带入这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别...
第7分钟了解(Wepoke透明... 第7分钟了解(Wepoke透明)外挂辅助插件安装黑科技(透视)透明挂教程(2024已更新)(哔哩哔哩...
9分钟了解(aapoker苹果... 9分钟了解(aapoker苹果版)黑科技透明挂辅助黑科技(透视)新版2025教程(2023已更新)(...
第三分钟了解(wpkai)外挂... 第三分钟了解(wpkai)外挂智能ai辅助插件(透视)分享教程(2022已更新)(哔哩哔哩);1、全...
第一分钟了解(wpk辅助)外挂... 第一分钟了解(wpk辅助)外挂智能ai辅助工具(透视)2025新版(2021已更新)(哔哩哔哩)是一...
2.4万亿参数原生全模态大模型... 1月22日,百度发布并上线原生全模态大模型文心5.0正式版。该模型参数达2.4万亿,采用原生全模态统...
苹果、三星、佳明有麻烦了!美国... 快科技1月21日消息,近日,美国国际贸易委员会(ITC)启动了一项针对可穿戴设备的专利侵权调查,目标...
6G第二阶段技术试验已启动 上... 1月21日,工业和信息化部新闻发言人、信息通信发展司司长谢存在新闻发布会上介绍:目前,我国5G标准必...
第3分钟了解(德州wepowe... 第3分钟了解(德州wepower)外挂智能ai辅助科技(透视)解说技巧(2024已更新)(哔哩哔哩)...