蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

AI重塑停车服务链路 鸿蒙元服... 6月13日,在华为开发者大会2026(HDC 2026)期间,“鸿蒙智泊·智慧服务——全场景智慧泊车...
脑机壹周讯|失明患者重见光明、... 本周(06.08-06.12),国内脑机接口企业在脑机行业资讯、脑机融资动态、脑机相关政策方面实现关...
消息称亚马逊AWS为降低AI推... IT之家 6 月 14 日消息,据 Wccftech 报道,富国银行 (Wells Fargo) 的...
2026年6月荣耀600系列,... 2026年6月的手机市场,荣耀600系列以“同价位段最好用好玩”的姿态强势登场,它凭借2亿像素AI超...
为南极永久月面基地铺路,美国 ... 感谢IT之家网友 的线索投递! 6 月 14 日消息,据外媒 New Atlas 昨天报道,美国 N...
Meta向旗下Quest 2/... IT之家 6 月 14 日消息,据外媒 UploadVR 报道,Meta 旗下全新 Navigato...
中国第二大手机系统!鸿蒙6终端... 快科技6月14日消息,在华为开发者大会上,华为正式发布新一代鸿蒙7操作系统。 据介绍, 鸿蒙已成为中...
海信取得换热器和空调器专利,有... 国家知识产权局信息显示,海信(广东)空调有限公司取得一项名为“换热器和空调器”的专利,授权公告号CN...
原创 日... 2026年6月12日,日本种子岛航天中心的清晨带着海风特有的潮湿气息,H3火箭六号机在轰鸣声中成功升...