蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

江西高速上线“有声哨兵” 近日 省交通投资集团吉安东管理中心 枢纽广播系统 在南韶高速、莆炎高速等 所辖高速的 40余个枢纽、...
带电逐光!靠谱小伙儿荣膺“南开... 清晨六点 南开园天色刚亮 走出学院楼时 一束晨光正落在董家斌的脸上 那天 他为获取一组关键的原位实验...
中国自动驾驶企业蘑菇车联与LG... 中国日报2月5日电 (记者 李佳颖)中国自动驾驶企业蘑菇车联(MOGOX)日前与全球科技和电子企业L...
海古德申请氮化硅陶瓷基板生坯检... 国家知识产权局信息显示,江苏海古德半导体科技有限公司申请一项名为“一种用于氮化硅陶瓷基板的生坯检测方...
强化学习远不是最优,CMU刚刚... 机器之心编辑部 在大模型时代,从代码生成到数学推理,再到自主规划的 Agent 系统,强化学习几乎成...
Intel CEO陈立武:华为... 快科技2月5日消息,继NVIDIA CEO黄仁勋、特斯拉CEO马斯克公开夸赞过华为之后,Intel ...
国际奥委会官宣:阿里千问成为史... “过去,我们通过卫星连接世界。今天,我们通过阿里巴巴的云和AI技术连接世界。” 2月5日,2026米...
杭可科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示杭可科技(688006)新获得一项实用新型专利授权,专利名为“...
诺基亚贝尔申请两阶段消息监测专... 国家知识产权局信息显示,上海诺基亚贝尔股份有限公司;诺基亚通信公司申请一项名为“两阶段消息监测”的专...
扬州至镇江±200千伏直流输电... 转自:扬子晚报 2月3日17点,扬州至镇江±200千伏直流输电二期工程一次性顺利通过120万千瓦满功...