蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

拼多多突然成立新公司 在互联网这片喧嚣的江湖里,拼多多向来是个沉得住气的角色。 它不喜欢张扬,平时非常低调,可一出手,往往...
薇娅最新动态:新总部落地杭州滨... 薇娅去哪了,在忙什么? 这大概是过去几年电商圈被问得最多、又很少有人能完整答上来的问题之一。直播间里...
粉笔张小龙辱骂人大学子,AI大... 6月3日晚,中国人民大学哲学院的一场讲座火了。 按照原计划,粉笔CEO张小龙应该来讲讲考公辅导行业。...
MONTECH迎来十周年,多款... IT之家 6 月 4 日消息,德隆 (Telon) 旗下 PC 机电散品牌 MONTECH(君主科技...
黄仁勋的“阳谋”与宇树的“跳板... 2026年6月1日,在Computex 2026的舞台上,英伟达创始人黄仁勋的身旁出现了一个与他“身...
全球百万富翁又增200万人?A... 财联社6月4日讯(实习编辑 李莹/编辑 齐灵)2025年,全球富豪们的财富进一步增长,高净值人群所持...
原创 宇... 6月1日,上交所一纸公告,“具身智能第一股”的悬念尘埃落定。 宇树科技,这家由90后创始人王兴兴创立...
“天生多屏”解锁数智新生活 中... 【环球网科技综合报道】6月3日,中兴通讯在北京举办“天生多屏”AI云电脑体验日活动,集中展出全栈AI...
木联能CGD光电工程软件-太阳... 近日,木联能完成CGD光电工程软件-太阳能热发电工程概算(STBE)(以下简称“光热概算软件”)产品...
极智嘉-W(02590.HK)... 北京极智嘉科技股份有限公司(股票代码:02590,简称:极智嘉-W)于2026年4月23日发布其20...