蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

中国工程院院士邓中亮到沙县基地... 近日中国工程院院士邓中亮一行到沙县现代化实战消防综合训练基地调研。中国消防救援学院、北京航空航天大学...
中国平板电脑线上销量榜出炉:苹... 快科技5月22日消息,今日,研究机构洛图科技发布数据显示,2026年第一季度,中国消费级智能平板市场...
滁州市副市长贡植平一行赴浙江新... 2026年5月21日,安徽省滁州市副市长贡植平一行赴浙江新再灵科技股份有限公司(以下简称“新再灵科技...
2026年618最新款折叠屏手... 随着618大促临近,许多消费者都在关注2026年的折叠屏手机新品,纠结于“折叠屏手机2026年新品6...
原创 “... 丰田,这家全球第二大汽车制造商,总是搞了个大新闻。之前他们展示了一台搭载固态电池的原型车,虽然视频只...
齐心集团亮相深圳文博会,齐心智... 5月21日至25日,第二十二届中国(深圳)国际文化产业博览交易会(以下简称“文博会”)在深圳国际会展...
2026年618小屏旗舰手机推... 随着618购物节的临近,许多追求极致性能和便携体验的玩家都在寻找一款既能满足高强度游戏需求,又拥有出...
2026年上半年受欢迎AI工作... 2026年上半年,企业数字化管理进入深水区,AI工作手机凭借软硬一体架构、全链路风控与深度AI赋能,...
腾讯以“好用的AI”激活数字文... 5月21日至25日,第二十二届中国(深圳)国际文化产业博览交易会(简称文博会)在深圳举办。腾讯以“好...
南昌 “空中交警” 上岗! 早晚高峰的拥堵、突发事故的滞留、 恶劣天气的隐患、大型活动后的疏散难题…… 这些长期困扰城市交通管理...