蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

“深圳智造”闪耀东盟博览会 六... 深圳商报·读创客户端记者 胡星访 第22届中国—东盟博览会将于9月17至21日在广西南宁举行,深圳展...
潮声丨从田间到云端,“算力土豆... 潮新闻客户端 执笔 林晓晖 陈久忍 在大多数人的印象里,一颗土豆,之前只能上餐桌,几毛一斤,最多的花...
“北京·亦庄科技馆之城”自动驾... 央广网北京9月15日消息(记者 朱冠安)近日,由北京经开区工委宣传文化部举办的“北京·亦庄科技馆之城...
华新精科获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示华新精科(603370)新获得一项实用新型专利授权,专利名为“...
蚂蚁数科外滩大会与14家单位达... 来源:新浪科技 新浪科技讯 9月15日下午消息,在近日举行的2025外滩大会上,蚂蚁数科与14家机构...
DeepSeek、宇树科技等被... 9月12日,《麻省理工科技评论》(以下简称“MIT科技评论”)“50家聪明公司”最新评选结果揭晓,D...
科学家研发出会变色的自修复凝胶... IT之家 9 月 14 日消息,中国台湾地区的研究人员开发出了一种具备可拉伸、自修复特性的凝胶,该凝...
智能“老师”点亮福泉校园科创课... 9月12日,福泉市“2025年AI人工智能机器人教学进校园启动仪式暨公开课”在福泉市第一小学举行。本...
《通信世界》2025年第十七期... 《通信世界》2025年9月10日 第17期 本期看点 “AI+”不是“+AI” “人工智能+”是...
wpk德州透视辅助(wPK)w... wpk德州透视辅助(wPK)wpk数据统计(透明挂)都是真的有挂(解说技巧)进入游戏-大厅左侧-新手...