蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

走进世优科技:数字人赛道的“扫... 在AI数字人赛道风起云涌的当下,众多企业聚焦于前端应用与市场声量。然而,有一家公司却如“扫地僧”般,...
量子计算机千比特测控系统出货!... 工业和信息化部表示,“十五五”时期将聚焦量子科技等领域,加强技术攻关、企业培育。当前量子科技作为新一...
乘数智“快车”,山东移动助力潍... 晨光刚漫过潍河的堤岸,安丘河洼村的田埂上就多了个熟悉的身影。山东移动潍坊分公司驻村第一书记田洪涛踩着...
从街边推车到年销十亿!湖北非遗... 极目新闻记者 赵贝 一台1996年5月24日出摊的小推车,30年来已成为小胡鸭企业文化的精神“化身”...
存储产业链扩产潮涌 多家公司积... 本报记者 丁蓉 当下,全球存储器市场迎来“超级周期”,产业链上下游亦同步吹响扩产号角。中关村物联网产...
【中证快报】1月12日中证投资... 【中证头条】 力鸿一号飞行器完成亚轨道飞行试验任务 --------- 1月12日,中科宇航力鸿一号...
AI医疗如何“下基层”? 应用... AI医疗如何“下基层”? 【场景创新面面观】 人工智能(AI)辅助解读患者影像资料,外骨骼机器人帮助...
中部第一城,何以卡位“第三极”... 每经记者|淡忠奎 每经编辑|刘艳美 商业航天概念持续火爆。1月12日,卫星ETF、卫星ETF易方达...
【市场观潮】数字人直播,别让带... 来源:滚动播报 (来源:工人日报) 近日,市场监管总局、国家网信办联合印发《直播电商监督管理办法》(...
自治区碳排放计量实现“精算” ... 近日,两只基于智能物联电表架构的新型“电碳表”在乌兰察布市两家重点用电企业完成安装调试并正式运行,标...