蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

模拟与混合信号芯片为何难以实现... 模拟与混合信号测试正处于一个重要转折点。尽管新标准首次让工程师能够量化这类关键器件的测试覆盖率,但要...
7000-8000元价位段原生... 对于热爱摄影,尤其是喜欢拍摄演唱会、体育赛事、远距离风光或野生动物等场景的用户来说,手机的长焦能力和...
天门亮出“十五五”科技创新“路... “十五五”时期,天门如何以科技创新引领产业创新,为新质生产力发展注入强劲动能?如何以科技之力撬动新时...
七天加满“AI朋友圈”,微信智... 文 | AI价值官,作者丨星野,编辑丨美圻 6月2日,腾讯港股单日涨超10%,市值暴增逾4000亿...
苹果高调发布Siri AI,但... 财联社6月9日讯(实习编辑 李莹/编辑 齐灵)时隔两年,苹果的Siri AI落地Beta版,但市场反...
机构:受存储器涨价影响,预估2... 来源:环球网 【环球网科技综合报道】6月9日消息,TrendForce集邦咨询最新研究显示,202...
库克落幕WWDC26,Siri... 2026年WWDC大会,注定要写进苹果发展史。这是蒂姆・库克以CEO身份站上舞台的最后一场发布会,一...
Donut Lab固态电池再遭... 【CNMO科技消息】芬兰初创企业Donut Lab此前在2026年拉斯维加斯CES上宣布,将于年内推...
库克挥泪告别,苹果AI的时间不... 北京时间6月9日凌晨,库克最后一次以苹果CEO身份站上WWDC(2026苹果全球开发者大会)舞台,说...
苹果iOS 27系统9月全面更... 2026-06-09 17:18:35 作者:狼叫兽 北京时间6月9日凌晨,苹果年度全球开发者大会...