蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

将用于飞机部件运输!我国新型滚... 6月6日,我国建造的用于运输飞机部件的滚装船在中船集团武昌造船厂顺利下水。这艘船交付后,将主要用于飞...
大模型管控太空天基太阳能发电人... 大模型管控太空天基太阳能发电人工智能AI系统平台软件 北京华盛恒辉大模型管控的太空天基太阳能发电系统...
三峡集团首个无人机智能巡检管理... IT之家 6 月 7 日消息,近日,三峡集团首个无人机智能巡检管理体系在内蒙古投入运行,首批覆盖 1...
黄仁勋给韩国带来的“惊喜”,原... 据韩联社报道,当地时间6月5日,正在韩国访问的英伟达首席执行官(CEO)黄仁勋表示,此次他为韩国带来...
MLCC需求暴涨,或成为“下一... (本文作者为 半导体产业纵横,钛媒体经授权发布) 文 | 半导体产业纵横 MLCC(Multi...
人形机器人有了“身份证” 国家人工智能应用中试基地(具身智能)展厅内的机器人为参观者递上咖啡。新华社记者 樊雨晴摄 人形机器人...
健康老人手表厂家推荐指南:沃普... 导语:随着中国老龄化进程加速,中老年群体对智能穿戴设备的需求持续释放。据行业白皮书显示,健康监测类智...
6月9日起精彩天幕“连续剧”将... 6月9日开始,“天幕剧场”将上演多场热闹的天体“盛会”。届时,金星、木星、水星、月亮等天体将在黄昏西...
画风清奇!Meta搭“帐篷机房... 【环球网科技综合报道】6月7日消息,据外媒Futurism报道,在全球AI算力极度紧缺、数据中心建设...
黄仁勋押注Token经济:你用... 新智元报道 【新智元导读】Dario Amodei预言AI行业奔万亿,黄仁勋偏说太保守。你每天在...