蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

把更多的“不可能”变成“一定能... 打赢脱贫攻坚战的伟大胜利,生态文明建设取得的历史性成就,“嫦娥”奔月、天问探火等重大科技成果举世瞩目...
国产AI大模型密集上新 22股... 证券时报记者 梁谦刚 据科技日报报道,1月28日,北京智源研究院主导的多模态大模型成果“Emu3”正...
【典型案例】设施农业向“新”提... 走进内蒙古通辽市的各个旗县区,一座座现代化的智能温室大棚如雨后春笋般涌现,成为乡村田野间最亮丽的风景...
100万颗卫星+AI,马斯克要... 美国企业家埃隆·马斯克旗下的太空探索技术公司(SpaceX)日前向美联邦通信委员会提交申请,拟在近地...
日活破亿!张一鸣又赌对了:字节... 快科技2月4日消息,在移动互联网流量见顶的“存量寒冬”里,字节跳动再次证明了其作为超级APP工厂的统...
汉中南郑:和牛“云”上养 智慧... 牛耳上的电子标签轻轻一扫,体重、健康等信息实时上传;手机APP预警一闪,工人即刻奔赴现场;大屏数据一...
汉特云取得人形机器人多摄像头特... 国家知识产权局信息显示,福建汉特云智能科技有限公司取得一项名为“一种人形机器人多摄像头特征融合方式”...
特斯拉终于拿下4680电池,结... 来源:市场资讯 (来源:网易科技) 马斯克来圆饼了。 2020年,特斯拉电池日上,马斯克画了一张叫“...
四川省华蓥市流量卡推荐看这里 办卡:微 信 公 众 号 搜【 可可 找卡】,每天更新运营商官方高性价比套餐!帮你精准匹配适配流量方...
县区动态|镇安县环境监测站:实... 为持续筑牢生态环境安全防线,全面提升监测队伍的专业素养与实战能力,近期,镇安县环境监测站以丹江流域涉...