万亿参数旗舰模型Ling-1T正式发布并开源
创始人
2025-10-10 10:22:34
0

封面新闻记者 张越熙

10月9日,蚂蚁集团发布万亿参数的通用语言模型 Ling-1T。Ling-1T是蚂蚁百灵大模型Ling 2.0 系列的第一款旗舰模型,也是蚂蚁百灵团队迄今为止推出的规模最大、能力最强的非思考大模型。测评显示,在有限输出 Token 条件下,Ling-1T于多项复杂推理基准中取得 SOTA 表现。

以竞赛数学榜单 AIME 25 (American Invitation Math Examination 25)为例,Ling-1T以平均4000+ Token的消耗达到了70.42%的准确率,优于Gemini-2.5-Pro(平均5000+ Token,准确率70.10%)。

据透露,Ling-1T 沿用 Ling 2.0 架构,在 20T+ tokens 高质量、高推理浓度的语料上完成预训练,支持最高 128K 上下文窗口,通过“中训练+后训练”的演进式思维链(Evo-CoT)极大提升模型高效思考和精准推理能力。

除此之外,Ling-1T 全程采用 FP8 混合精度训练(部分技术已开源),是目前已知规模最大的使用 FP8 训练的基座模型。这一设计为训练带来了显著的显存节省、更灵活的并行切分策略和 15%+ 的端到端加速。

在强化学习阶段,百灵团队提出了LPO方法(Linguistics-Unit Policy Optimization,LingPO) ,这是一种以“句子”为粒度的策略优化算法,为万亿参数模型的稳定训练提供了关键支持。这种方法既避免了词元级别的破碎感,也克服了序列级别的笼统性,使得奖励信号与模型行为在语义层面实现了更精准地对齐。

记者了解到,除了Ling-1T这款非思考模型,蚂蚁百灵团队还在训练万亿参数级的深度思考大模型Ring-1T,已在9月30日开源了preview版。

相关内容

热门资讯

科创向前一步,金融先行一步 (来源:新安晚报) 转自:新安晚报 实验室里的科研突破如何蜕变为产业蓝海的创新动能?在科技创新正在加...
AI驱动爆款视频复刻工具的技术... 随着短视频平台的兴起,爆款视频的复制和再创作成为内容创作者和营销人员的关键需求。AI视频复刻工具应运...
原创 时... 前几天,刷到华为 Pura80 Ultra官网直降1500元,部分第三方平台价格更是可以下降3000...
苹果、小米17系列首周销量对比... 【CNMO科技消息】10月10日,有数码博主发布了一张小米17系列与iPhone 17系列首周销量对...
Qwen要做机器人了:林俊旸官... 机器之心报道 机器之心编辑部 已经成为开源模型领头羊的 Qwen,终于要开始做机器人了。 昨天,阿里...
SunRISE任务详解:NAS... IT之家 10 月 10 日消息,美国宇航局(NASA) 10 月 1 日发布博文,宣布计划于 20...
AI“以小博大”新标杆:三星开... IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报...
原创 全... 日本又“炸”了——这次,不是政坛,而是科学界。 本以为逢5逢10该轮到"应用年"——搞不好是哪种治癌...
选型踩雷3次后,我们总结了这份... 🔥🔥 AllData大数据产品是可定义数据中台,以数据平台为底座,以数据中台为桥梁,以机器学习平台为...
原创 毅... 刷到毅力号相关消息时我正啃着面包,第一眼真差点噎着 —— 火星的石头居然要飘回地球了?可再往下看,那...