蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

铜陵学院在第九届中国高校智能机... 5月24日,2026年第九届中国高校智能机器人创意大赛“软件系统安全赛”全国总决赛在中国科学技术大学...
凯格精机获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示凯格精机(301338)新获得一项实用新型专利授权,专利名为“...
飞向太空的红飘带 新华社酒泉5月27日电 题:飞向太空的红飘带 新华社记者李国利、黄一宸、刘艺 两段波澜壮阔的远征,交...
原创 N... NASA公布了其首个月球基地的远期规划,人类有望在六年内实现在月球表面生活和工作的目标。 该前哨站...
国网天津电力:“科技+绿色”双... 天津北方网讯:2026世界智能产业博览会将于5月28日至31日在国家会展中心(天津)举行,规划展览面...
迷失在数字里:严筱磊带领的盒马... 侯毅时代的盒马,是马云亲自站台、广开创新业态的"新零售宠儿";严筱磊时代的盒马,是只看数据、埋头算账...
光伏逆变器测试设备厂家梳理 新... 导语:光伏逆变器测试设备作为新能源领域的关键检测工具,其性能直接影响光伏系统的发电效率与安全稳定性。...
走在前作示范挑大梁,广东亮思路 “热忱邀请大家来广东发展,共享智能经济新机遇。”在“开局起步‘十五五’”广东专场新闻发布会上,省发展...
AI智能体:不止聊天,真能干活 2026年,一场从“对话AI”到“行动AI”的变革正在发生。这场变革的引爆点,源于一款名为OpenC...
集体涨价!大模型开始找你“要钱... 智东西 作者 | 江宇 编辑 | 心缘 最近一个月,大模型商业化迎来了最具戏剧性、也最分裂的一幕。 ...