蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

华为花100亿在东莞建了个欧洲... ✦ 现场观察 ✦ HDC 2026 · 松山湖 · 三日观察 华为开发者大会(HDC 2026)在松...
给AI发放数字身份证!7项国标... 封面新闻记者 戴云 近日,市场监管总局批准发布《人工智能 智能体互联》系列7项国家标准,也是我国首个...
微言 | “灵晟“超算重夺世界... 最近“中国超算重回世界第一”的话题冲上热搜。据媒体报道,6月23日,在德国汉堡发布的第67期全球超级...
激光共聚焦显微镜的表面粗糙度测... 传统触针式粗糙度仪应用比非接触测量应用的广泛,但面对软质材料、复杂微结构和高精度表面时,材质会容易受...
2026天府人工智能产业生态暨... 6月25日,作为“中外企业四川行”的重要活动之一,以“场景牵引 以用促产”为主题的2026天府人工智...
中国信通院联合华为云等22家单... IT之家 6 月 26 日消息,6 月 25 日,中国人工智能产业发展联盟(AIIA)正式启动词元(...
原创 I... 按照正常的节奏,今年台积电、三星们会量产2nm芯片,而intel已经量产了18A芯片,也就是2nm芯...
走进深圳龙岗机器人街区 近年来,深圳龙岗区打造全国首个机器人街区,集机器人剧场、实验场、产业园区于一体,开设全球首家机器人6...