蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

TrendForce:主要NA... IT之家 5 月 25 日消息,机构 TrendForce(集邦)今日根据最新 NAND 闪存产业调...
730千米/小时!爱好者非正式... IT之家 5 月 25 日消息,两名无人机爱好者刚刚非正式打破了无人机速度世界纪录,单次试飞中飞出最...
走出“AI万能论”摆脱“AI焦... 5月22日上午,2026文化强国建设高峰论坛人工智能驱动文化产业创新发展论坛在深圳国际会展中心举行。...
AI如何赋能“望闻问切”?杭州... “中医药与人工智能深度融合,将有力推动诊疗标准统一化、产业发展国际化,同时对中医药科普和中医药文化传...
网传腾讯字节高管互喷“短视频像... 近日,网络上流传一则腾讯与字节跳动高管互相批评短视频内容的言论。网传,腾讯副总裁批低智洗脑短视频像猪...
【贵商易】工业互联网与油气储运... 关于印发《工业互联网与油气储运行业融合 应用参考指南(2026年)》的通知 工信厅信管函〔2026〕...
记者实探三大运营商:Token... 文|《科创板日报》 三大运营商集中上线 Token 套餐,AI算力进入话费支付时代? 从卖语音到卖...
再出征!“成都造”全程护航神舟... ▲2026年5月24日,搭载神舟二十三号载人飞船的长征二号F遥二十三运载火箭在酒泉卫星发射中心点火发...
水稻培育、能源供给……神舟二十... 新华社北京5月25日电(记者胡喆、顾天成)神舟二十三号载人飞船发射入轨后,于5月25日凌晨成功对接于...