蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

科学家开发出AI驱动的6G核心... 科技日报 科技日报记者 张佳欣 据最新一期《IEEE通讯》杂志报道,韩国电子通信研究院研究团队开发出...
“上海老人疯抢2.3万元保姆机... 一段时间以来,“机器人保姆进入家庭”的信息在社交平台颇为热门,此前还有消息称“上海老人疯抢2.3万元...
以模创社区为支点 和平区深度涵... 天津北方网讯:6月16日,天津市政府新闻办举行“开局起步‘十五五’”和平区专场新闻发布会。和平区投资...
原创 谁... 一年融资超500起,整机、大脑、数据采集被疯抢。 定焦One(dingjiaoone)原创 作者 |...
发现个奇怪现象:为何大家都喜欢... 谁在掏手机的那一刻,已经替你选好了? 你有没有留意过一个细节——小区门口卖早点的摊位上摆着两张收款...
具身智能新风向!星海图宣布:完... 【导读】星海图宣布:完成“整机+智能”战略闭环 中国基金报记者 卢鸰 具身智能头部玩家星海图三年前确...
Mindbeam推开源AI框架... 成立仅两年的初创公司 Mindbeam AI 今日发布了一款名为 Litespark-Inferen...
澳洋顺昌取得背光模组专利提升抬... 国家知识产权局信息显示,淮安澳洋顺昌光电技术有限公司取得一项名为“一种背光模组、显示装置和抬头显示系...
Snap旗下首款面向普通消费者... IT之家 6 月 17 日消息,Snap 今日正式发布首款面向普通消费者的独立式 AR 眼镜 Sna...