万亿参数旗舰模型Ling-1T正式发布并开源
创始人
2025-10-10 10:22:34
0

封面新闻记者 张越熙

10月9日,蚂蚁集团发布万亿参数的通用语言模型 Ling-1T。Ling-1T是蚂蚁百灵大模型Ling 2.0 系列的第一款旗舰模型,也是蚂蚁百灵团队迄今为止推出的规模最大、能力最强的非思考大模型。测评显示,在有限输出 Token 条件下,Ling-1T于多项复杂推理基准中取得 SOTA 表现。

以竞赛数学榜单 AIME 25 (American Invitation Math Examination 25)为例,Ling-1T以平均4000+ Token的消耗达到了70.42%的准确率,优于Gemini-2.5-Pro(平均5000+ Token,准确率70.10%)。

据透露,Ling-1T 沿用 Ling 2.0 架构,在 20T+ tokens 高质量、高推理浓度的语料上完成预训练,支持最高 128K 上下文窗口,通过“中训练+后训练”的演进式思维链(Evo-CoT)极大提升模型高效思考和精准推理能力。

除此之外,Ling-1T 全程采用 FP8 混合精度训练(部分技术已开源),是目前已知规模最大的使用 FP8 训练的基座模型。这一设计为训练带来了显著的显存节省、更灵活的并行切分策略和 15%+ 的端到端加速。

在强化学习阶段,百灵团队提出了LPO方法(Linguistics-Unit Policy Optimization,LingPO) ,这是一种以“句子”为粒度的策略优化算法,为万亿参数模型的稳定训练提供了关键支持。这种方法既避免了词元级别的破碎感,也克服了序列级别的笼统性,使得奖励信号与模型行为在语义层面实现了更精准地对齐。

记者了解到,除了Ling-1T这款非思考模型,蚂蚁百灵团队还在训练万亿参数级的深度思考大模型Ring-1T,已在9月30日开源了preview版。

相关内容

热门资讯

以法治之光,照亮数字时代的深度... 以法治之光,照亮数字时代的深度阅读之路 近日,《全民阅读促进条例》正式公布实施,将我国在全民阅读领域...
卫星、机器人“肌肉”都能打 3... 机器人的“肌肉”、要上天的卫星,还有生活中的各种小物件,现在都可以通过3D打印出来。AI设计、仿真模...
2亿像素连续光变+烟花神器!小... 12月25日晚,小米举办旗舰新品发布会,正式推出小米17 Ultra,512GB起步,售价6999元...
选小米17 Ultra还是徕卡... 选小米17 Ultra还是徕卡版,本质是选“顶级工具”还是“信仰玩具”。普通版是性能拉满的影像旗舰,...
大唐电商公司“非招智能评”项目... 12月25日,大唐电商公司的“非招智能评”项目正式落地。该项目以多模态大模型为核心,实现了非招标采购...
三星Galaxy S25 Ul... 在安卓旗舰机市场,三星Galaxy S系列始终占据着独特地位。 S25 Ultra作为2025年的新...
普及知识!微扑克辅助软件,微扑... 普及知识!微扑克辅助软件,微扑克如何让系统发好牌(微扑克)一直有挂(有挂存在)-哔哩哔哩1、玩家可以...
终于清楚!微扑克辅助插件挂,微... 终于清楚!微扑克辅助插件挂,微扑克有挂么(微扑克)本来存在有挂(有挂方式)-哔哩哔哩;1、操作简单,...
分享一款!微扑克辅助工具,微扑... 分享一款!微扑克辅助工具,微扑克有挂么(微扑克)果然有挂(有挂头条)-哔哩哔哩1.微扑克辅助工具 a...
一分钟了解!微扑克有脚本吗,微... 一分钟了解!微扑克有脚本吗,微扑克有挂么(微扑克)切实真的有挂(有挂解惑)-哔哩哔哩;1)微扑克有脚...