蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

原创 神... 黄岩岛,又传来一个重磅消息。 日前,中国生态环境部发布《2025年黄岩岛蓝洞调查报告》,宣布我国科研...
乐奇Rokid全球首发AI眼镜... IT之家 6 月 26 日消息,在今日的 Rokid Open Day 2026 全球生态及开发者大...
机智局丨巡逻、送餐、擦玻璃……... 深圳商报·读创客户端记者 任建新 文/图 想跟机器人来一场“石头剪刀布”?想看机甲战士在绿茵场上踢出...
美国化工生产遭遇AI冲击 来源:市场资讯 (来源:中化新网) 美国人工智能(AI)数据中心迅速扩张,正在以前所未有的速度吞噬电...
成都4家人工智能企业,升“链主... 4家蓉企 新晋四川省人工智能产业链主 成都AI产业龙头集聚效应 持续放大 6月25日下午,作为202...
原创 2... 618大促最后冲刺!预算2000-3000元想买手机的朋友,千万别盲目下单!你是不是也有这种困扰:看...
苏州“珠峰小队”:国家需要,就... 初夏的苏州工业园区,梧桐荫浓。走进苏州华兴源创科技股份有限公司研发车间,示波器屏幕上跳动的绿色波形,...
2026年折叠屏手机推荐:哪款... 随着折叠屏技术日趋成熟,越来越多的用户开始将折叠屏手机作为主力机使用。在年中这个换机高峰期,大家最关...
2026年618手机推荐:30... 随着618购物节的到来,很多朋友都在寻找一款拍照好、功能全面的手机,预算集中在3000到4000元这...
人大和微软开源Arbor,一棵... 科学研究是一个反复试错的过程。研究者试一个方向,看结果,把教训带进下一次尝试。 能不能让 AI Ag...