蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

星河动力回应发射失利 1月17日12时08分,星河动力谷神星二号运载火箭在酒泉卫星发射中心点火升空,火箭飞行异常,首次飞行...
原创 赵... 赵今麦终于学会了自动版wink,六年坚持练成的技巧背后有何故事? 赵今麦终于掌握了自动版wink这一...
3万余人看火箭发射!日照靠“航... 1月16日凌晨4时10分,我国太原卫星发射中心在山东附近海域成功发射谷神星一号海射型遥七运载火箭,搭...
谷神星二号民营商业运载火箭首飞... 1月17日12时08分,星河动力旗下谷神星二号民营商业运载火箭在酒泉卫星发射中心点火升空,火箭飞行异...
互联网+美育赋能 中国童模网筑... 深耕少儿美育与童模行业十余年的何女士,亲历了行业从小众探索到规范化发展的全历程,凭借对产业痛点的精准...
长鑫闵科申请数据传输电路及存储... 国家知识产权局信息显示,长鑫闵科存储技术(上海)有限公司申请一项名为“数据传输电路及存储器”的专利,...
数据为壤,智能花开:十年之间,... 十年,能让一粒种子长成什么模样?若在2015年——贵州开启“大数据元年”之时,许多人或许难以想象,那...
100%关税!美国,突发威胁!... 美国在半导体领域动作不断。 据最新消息,美国商务部长卢特尼克威胁称,如果韩国存储芯片制造商不在美国增...
华东润滑取得智能离芯式净油机专... 国家知识产权局信息显示,南通市华东润滑设备有限公司取得一项名为“智能离芯式净油机”的专利,授权公告号...
原创 首... 三星Galaxy S25 Ultra,作为2025年三星的旗舰力作,凭借其强悍的性能表现、顶尖的影像...