蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

2026互联网优质内容创作盛典... 5月30日晚,2026互联网优质内容创作盛典在上海举行。全球数百位互联网创作者代表及行业领军人物齐聚...
不止伴舞还开嗓演唱!宇树机器人... 快科技5月30日消息,5月29日晚,王力宏杭州演唱会迎来特别嘉宾 —— 宇树 G1人形机器人登台献艺...
这个周末,他们在重庆科技馆“种... 当国家大科学装置“人造太阳”走出实验室,与青少年的奇思妙想相遇,会擦出怎样的火花?5月30日,正值第...
2026年上海科技节闭幕,“科... 随着一段AI媒体播报带领观众重温科学红毯秀、科技传播大会等精彩瞬间,5月30日,2026年上海科技节...
荣登CCTV民族品牌,青岛海大... 近日,青岛海大生物集团股份有限公司成功入选CCTV《铸造民族品牌 传承工匠精神》项目,同步登陆CCT...
看不懂华为韬定律?拆解中国芯片... 2026年5月25日,上海IEEE国际电路与系统研讨会的现场,一张写着“韬(τ)定律”的幻灯片,瞬间...
互联网信息内容多渠道分发服务管... 国家互联网信息办公室 中华人民共和国公安部 中华人民共和国文化和旅游部 国家市场监督管理总局 国家广...
2026年5月新手充电宝避坑指... 一、选宝焦虑终结者:科学选购充电宝,拒绝盲目跟风 多数消费者选购充电宝都有踩坑经历:高价大牌产品普遍...
小程序UV科普全攻略:揭秘独立... 对于许多刚踏入微信小程序生态的开发者或运营新手来说,后台数据面板上密密麻麻的指标往往让人摸不着头脑。...
易达天车取得小型天车的驱动机构... 国家知识产权局信息显示,深圳市易达天车智造有限公司取得一项名为“小型天车的驱动机构”的专利,授权公告...