蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

上海义文取得内置型弹簧铰链专利... 国家知识产权局信息显示,上海义文机电有限公司取得一项名为“一种内置型弹簧铰链”的专利,授权公告号CN...
如何将MATLAB网络并发许可... 如何将MATLAB网络并发许可证闲置率降至10%以下 在当今企业数字化转型的浪潮中,MATLAB作为...
央视《新闻联播》聚焦贵阳首家机... 1月25日,央视《新闻联播》播出由贵州广播电视台和贵阳市融媒体中心协助采制的《各地拓展新业态新场景 ...
MiniMax把自家“实习生”... 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 曾经那些将需求、设计与代码强行割裂的流水线,...
南京新增一“灯塔工厂” 来源:滚动播报 (来源:新华日报) 本报讯 近日,世界经济论坛公布最新一批“灯塔工厂”名单,16家入...
打造核聚变装置集群 1月15日,航拍的建设中的紧凑型聚变能实验装置BEST。 1月13日,维护改造中的“人造太阳”全超...
连港智造取得离型纸辊涂机专利,... 国家知识产权局信息显示,江苏连港智造科技有限公司取得一项名为“离型纸辊涂机”的专利,授权公告号CN2...
微软承认Windows 11新... 快科技1月25日消息,近日,不少用户报告称,包括记事本、截图工具、画图甚至Windows 安全中心在...
联想“乐享壹号”百店行南京站,... 1月25日上午,南京联想体验店金陵中环店新店开业,一场别开生面的机器人太极表演吸引了众多市民驻足观看...
无解死循环!修Windows ... 快科技1月25日消息,如今Windows系统的更新似乎正陷入一场套娃式的修复死循环,今天,微软针对W...