蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

微信更新“面对面收照片和文件”... 【太平洋科技快讯】2月25日消息,微信员工“客村小蒋”昨天在微博发文,详解微信最近更新的“面对面收照...
创新赋能发展!临空4项创新案例... 创新犹如一把金钥匙,能够开启新的发展机遇之门,为区域经济腾飞注入源源不断的活力。2025年,首都机场...
开源兼容层Wine 11.3发... IT之家 2 月 25 日消息,科技媒体 Linuxiac 昨日(2 月 24 日)发布博文,报道称...
春晚同款机器人表演咨询量激增,... 马年春晚上一场《武BOT》的表演,机器人以兼具丝滑和力量的武术动作“震撼”全国观众。 舞台上机器人...
大族数控获得发明专利授权:“光... 证券之星消息,根据天眼查APP数据显示大族数控(301200)新获得一项发明专利授权,专利名为“光束...
AI会增加人类智商!清华大学专... 快科技2月25日消息,近日,中国工程院外籍院士、清华大学智能产业研究院(AIR)创始院长张亚勤预测表...
道氏技术获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示道氏技术(300409)新获得一项发明专利授权,专利名为“一种...
原创 开... 当美国科技巨头甩出亿美元级别的天价筹码一周内闪电挖走四名中国籍AI顶尖工程师时,这场看似简单的人才流...
开箱体验:实测心系天下三星W2... 对于商务精英而言,被海量信息裹挟,保持自身节奏与秩序、在信息洪流之中从容自处,堪称必备素养。对我来说...
PCB产业升级红利凸显 瑞丰高... AI技术迭代推动PCB(印刷电路板)产业向高性能、高密度升级,叠加高端电子材料国产替代进程的深化,上...