蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

榜题征集正式开启!这个全国青年... 2026年度中国青年科技创新“揭榜挂帅”擂台赛榜题征集正式开启 如果您正面临 一个亟需突破的技术瓶颈...
老黄重磅发声:机器人ChatG... 2026年1月,美国拉斯维加斯国际消费电子展(CES)如期而至,全球科技目光再次聚焦于此。这一次,舞...
蓝思科技CES 2026首次公... 当地时间1月6日—9日,全球科技产业的年度盛宴——美国消费电子展(CES)在拉斯维加斯举行。 记者获...
利安科技取得注塑件脱模装置专利... 国家知识产权局信息显示,利安科技(合肥)有限公司取得一项名为“一种注塑件脱模装置”的专利,授权公告号...
英伟达重注Groq背后,中美疯... 文 | 华商韬略 2025年11月,一则传闻震动硅谷: Meta正考虑在其数据中心,大规模采用谷歌...
功能性无人车发生交通事故后,责... 随着无人驾驶技术的不断发展,外形方方正正的功能性无人车进入了我们的生活。一旦发生事故,功能性无人车到...
原创 不... 哈喽,大家好,今天小睿这篇科技深度解析,就来聊聊马斯克官宣2026年量产脑机接口这事儿,科幻里的 “...
超女无缘国内期待榜,DC重启遇... 2025-12-30 13:41:11 作者:狼叫兽 豆瓣最新数据显示,尽管超女被定位为詹姆斯·...
方大炭素自主研发新型锯切装置获... 来源:甘肃日报 近日,方大炭素自主研发的“阴极炭砖产品锯切小车装置”获得国家知识产权局实用新型专利授...
智能配送加持,青岛驶向“全球无... 来源:滚动播报 (来源:工人日报) 最近,青岛中机工具有限公司总经理戴永兴尝到了无人配送的甜头——用...