蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

海信取得换热器和空调器专利,有... 国家知识产权局信息显示,海信(广东)空调有限公司取得一项名为“换热器和空调器”的专利,授权公告号CN...
原创 日... 2026年6月12日,日本种子岛航天中心的清晨带着海风特有的潮湿气息,H3火箭六号机在轰鸣声中成功升...
华为正式发布鸿蒙7开发者Bet... 北京商报讯(记者 金朝力) 6月12日,在华为开发者大会2026(HDC2026)上,Harmony...
我国气象科研团队巧解融化层雷达... 进入夏季,降水频频。气象雷达作为监测降水的利器,靠发射电磁波、接收回波来“看”雨的走势和规模。然而,...
原创 美... 神舟二十号是在2025年4月24日从酒泉卫星发射中心点火升空的,乘组由陈冬、陈中瑞、王杰三人组成。起...
9000毫安电池塞进手机?国产... 9000mAh电池塞进手机?vivo Y600 Turbo发布后,评论区先"炸"了 “大兄弟,你手机...
张雪机车被冠军推上牌桌 文 | 高恒说 张雪机车最难的事,可能不是继续赢比赛。 6月13日,在2026世界超级摩托车锦标赛...
打造共享用工与技能人才服务高地 来源:滚动播报 (来源:唐山劳动日报) 本报讯 (王雪纯、马佳明)近日,河北省“技能照亮前程”职业技...
东北老工业基地转身:AI进厂,... 近日,时代周报记者跟随工信部“新型工业化媒体调研行”走访辽宁沈阳、大连两地,厂房里的景象正在刷新外界...
HDC 2026正式开幕,华为... 6月12日,华为开发者大会在东莞正式启幕,在现场的我给大家分享一组鸿蒙生态最新喜讯:HarmonyO...