蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

以“确定性”重塑体验,滴滴租车... 随着清明、五一假期临近,租车出游市场热度攀升,订单量同比增长显著。然而,车辆临时取消、费用不透明、事...
长沙五一商圈有位“网红”,交警... 4月1日,长沙五一广场核心商圈正式迎来交通管理“新成员”,警用无人巡逻车正式亮相,国金中心司门口智能...
雷军:新一代小米SU7锁单量超... IT之家 4 月 2 日消息,在今晚的雷军拆一拆新 SU7 的直播中,小米创办人、董事长兼 CEO ...
消息称苹果iOS 27快捷指令... 4 月 1 日消息,根据尼古拉斯 · 阿尔瓦雷斯发现的后台代码、经 MacRumors 证实,苹果正...
起底价格不透明的家电维修 家电维修服务长期存在价格不透明、收费偏高、标准缺失等乱象,令消费者深陷“高价维修”困境。近日,据多位...
原创 别... iPhone 18 Pro的模具图居然在网上偷跑了!这波爆料可以说直接把大家的期待值拉满了,那么这款...
从机器人到电动航空,卧龙电驱卡... 出品 | 子弹财经 作者 | 星芒 编辑 | 闪电 美编 | 倩倩 审核 | 颂文 智能机器人的热度...
透视脚本!给大家普及一下wep... 给大家普及一下wepoker开挂透视方法是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器...
透视脚本!WePoKer有没有... 您好:WePoKer有没有透视软件挂的软件,软件加客服确实是有挂的,很多玩家在这款游戏中打牌都会发现...
透视脚本!微扑克发牌规律性,W... 您好,WePoker透视挂效果如何这款游戏可以开挂的,确实是有挂的,需要了解加微【136704302...