蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

雷士光电取得导轨灯及其电源盒组... 国家知识产权局信息显示,惠州雷士光电科技有限公司取得一项名为“导轨灯及其电源盒组件、照明系统”的专利...
“十五五”期间,中国将实施“系... 新京报讯(记者张璐)11月24日,记者获悉,“十五五”期间,中国科学院国家空间科学中心将组织实施包含...
“突破想象的未来”张小花《电子... 潮新闻客户端 11月22日,“突破想象的未来”网络文学征文大赛颁奖典礼在阅文书园举行。阅文集团首席执...
中鲲智能申请一种便于散热的充电... 国家知识产权局信息显示,深圳中鲲智能科技有限公司申请一项名为“一种便于散热的充电柜”的专利,公开号C...
在一起,就可以!总台《鸿蒙星光... 在一起,就可以!在数字中国建设十周年与“十四五”规划收官之际,由中央广播电视总台与广东省人民政府联合...
AI学研工具 | 经纶知识服务... KNOWLEDGE 经纶 2.0 使用指南 经纶简介 经纶是维普智图打造的在线知识服务平台。平台以全...
这场科普大赛上,普陀区斩获多个... 日前,第七届长三角一体化“科普动起来”家庭创新制作大赛落下帷幕。普陀区参赛队伍以一等奖1名,二等奖4...
复古科技爱好者自制打孔带读卡器... IT之家 11 月 24 日消息,据外媒 Tom's Hardware 今日报道,一位复古计算爱好者...
年产值10亿元 两江新区又一智... 11月24日,两江新区企业 (简称“原力聚合机器人”) 智能工厂正式投产。 一起来看看↓↓ 该工厂总...