蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

2026年小程序开发制作公司测... 随着小程序生态持续扩容,多平台渗透与技术迭代加速,2026年企业对专业开发服务的需求愈发迫切。本文选...
激光+LCoS原型光机首次亮相... 首次展出“激光+LCoS”原型AR光机,并发布RGB全彩单目双镜LCoS AR光机“蜻蜓C1”。在A...
2025年电信手机卡套餐避坑指... 办卡关注 微 信 公 众 号 :找卡乐园 这里是专为你打造的流量卡服务站,既能帮你揭开流量卡市场的各...
蜂巢能源申请单体电池及电池包专... 国家知识产权局信息显示,蜂巢能源科技股份有限公司申请一项名为“单体电池及电池包”的专利,公开号CN1...
陕西移动延安分公司:开展居民区... “以前电梯接电话总断音,地下室刷码都卡顿,现在走到哪儿信号都满格,用网特别顺畅!”延安宝塔区某小区居...
工信部:我国近期已启动第二阶段... 人民网北京1月21日电 (记者申佳平)在国务院新闻办公室1月21日举行的发布会上,工业和信息化部新闻...
2026年亲测好用的苹果照片去... 在当今数字化时代,图片和视频的使用频率日益增高,去水印的需求也愈发迫切。为了给广大苹果用户筛选出最实...
苏州元脑智能申请数据回溯方法专... 国家知识产权局信息显示,苏州元脑智能科技有限公司申请一项名为“一种数据回溯方法及电子设备”的专利,公...
三星显示为极氪9X供应3款车载... 1 月 21 日消息,三星显示 (SDC) 今日宣布,该企业自 2025 年下半年开始持续为极氪 9...
2026,从蚌埠“智造强市”看... 智能传感产业以“按薪定才”招才引智、8吋MEMS晶圆线建成投产,玻璃产业摘下中国专利金奖、航天航空产...