蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

在广州做小程序搭建,本地平台和... 在广州做小程序搭建,本地平台和线上平台差在哪?一篇讲透 广州的中小企业数量庞大,对小程序的需求也一直...
“智能物种”第一股量化派登榜2... “量化派已完成从消费科技向智能硬件与具身智能的战略进阶。”5月17日,2026福布斯中国人工智能科技...
电竞机皇降临!红魔11S Pr... 快科技5月18日消息,今天下午,红魔11S Pro正式面向市场发布,作为年度电竞旗舰的升级款,全系列...
杨子家族套现28个亿后,公司被... 有“明星光环”的商业航天大牛股,出事了。 5月15日晚间,演员杨子家族掌控的A股公司巨力索具发公告称...
国内首次!128 通道全植入式... 感谢IT之家网友 、 、 的线索投递! 5 月 18 日消息,据央视新闻报道,今天我国首个 128...
中国移动甘肃公司:以科技硬实力... 在兰州中山桥,游客拍完照片秒传朋友圈;在兰州老街,云游戏画面丝滑流畅;在中川机场,旅客刷脸过安检,行...
卧龙电驱50Mvar分布式调相... 大象新闻记者 魏广宝/图文 5月15日,卧龙电驱旗下卧龙电气南阳防爆集团股份有限公司50Mvar分...
全省100家营业厅同步“科普秀... 极目新闻记者 兰莎 通讯员 许国胜 章明慧 5月17日,2026世界电信和信息社会日大会在武汉召开。...
就去了趟厕所,人类险些输给机器... 刚刚,一场人类尊严保卫战以险胜告终。 事情是这样的。当地时间上周三开始,一家名叫 Figure A...
A2A能力网络平台UUMit正... 2026年5月18日,全新AI能力交易平台UUMit(小龙人) 正式启动上线,定位全球A2A(Age...