蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

小米取得铰链及可折叠电子设备专... 国家知识产权局信息显示,北京小米移动软件有限公司取得一项名为“铰链及可折叠的电子设备”的专利,授权公...
我国天舟十号货运飞船整装待发,... IT之家 5 月 11 日消息,据中国载人航天工程办公室官方平台消息,目前,长征七号遥十一运载火箭已...
中部智算枢纽:输送“数字水电煤... 本报记者 贾丽 算力,是数字经济时代的“水电煤”,也是人工智能产业的发动机。当下,算力正向智算、科学...
津南这家“小巨人”又有新突破 天津北方网讯:“五一”假期刚过,位于天津市津南区的华海清科股份有限公司(简称“华海清科”)传来新消息...
工信部批复6G技术试验频率!这... 来源:e公司 6G发展正处于从技术探索迈向未来产业的关键阶段。 工信部批复6G技术试验频率 为进一步...
在海外如何观看腾讯视频?实用指... 作为一名在海外工作的华人,我太懂打开腾讯视频时的无奈:要么提示“该内容仅中国大陆可用”,要么视频加载...
OpenAI推出可在说话时进行... OpenAI刚刚发布了三款新的实时语音模型,称这些模型将“为开发者解锁新一类语音应用”。每款新的语音...
太火了!深圳人最近为何扎堆消费... “五一”假期 深圳华强北的荣耀门店内 市民王先生正拿着最新发布的 折叠屏手机Majic V6反复体验...
【深度融合】四部门发文促进人工... 8日,由国家发展改革委、国家能源局、工业和信息化部、国家数据局联合编制的《关于促进人工智能与能源双向...
产业观察:卫星物联网商用“破冰... 来源:星沙时报 来源:人民网 5月6日,北京国电高科科技有限公司(以下简称国电高科)正式获批开展卫星...