蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

1U服务器机箱厂家梳理 数据中... 导语:基于2026年服务器硬件行业白皮书及公开市场数据,1U服务器机箱选型需聚焦散热效率、扩展兼容性...
2026年石家庄高新区学生手机... 随着智能手机全面融入学生群体的学习与日常生活,选购一款适配需求的高性价比防水手机,成为不少石家庄高新...
防爆扬声器厂家梳理 工业场景安... 导语:在工业生产环境中,防爆扬声器作为安全通讯的核心设备,其防爆性能、抗噪能力及稳定性直接影响作业安...
在世界屋脊聆听宇宙之声   6月20日拍摄的羊八井国际宇宙射线观测站(无人机照片)。   在西藏当雄县羊八井镇海拔4300米...
IBM宣称推出全球首个亚纳米芯... IBM推出的全新芯片架构,可在指甲盖大小的芯片上集成近1000亿个晶体管,晶体管密度约为该公司上一代...
福州九举措“力挺”人工智能产业 市政府办公厅近日印发《福州市促进人工智能产业发展若干措施》,涵盖模型开发、研发创新、场景应用等九条举...
区投促中心组织召开“投资朝阳”... 近日, “投资朝阳”小程序升级为中英双语版,并已上线试运行。为进一步发挥小程序作用,6月24日,区投...
荣耀Magic V6斩获亚洲最... 2026MWC上海展会期间,全球移动大奖·亚洲(GLOMO Awards Asia)正式揭晓。荣耀最...
怎么选择沈阳沃方宽安装合作方 随着数字化生活的普及,宽带已经成为居民日常用网、企业办公运营的刚需配套,沈阳本地的宽带服务市场供给充...
原创 美... 芯片制造离不开各种设备,按照专业说法,从砂子变成芯片,中间需要几千道工序,几百种设备,比如光刻机、刻...