蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

数智赋能沃野 联通助力春耕 当春耕的号角在广袤田野上吹响,中国联通将5G、物联网、大数据等新一代信息通信技术,深度融入农田管理、...
原创 西... 非洲、中东、拉美这些"全球南方"的伙伴们,提到中国基本都竖大拇指,巴不得中方的工程队赶紧把高铁、港口...
宇宙神秘蓝色闪光成因新解:黑洞... IT之家 5 月 10 日消息,在宇宙深处,存在一种神秘且能量极强的蓝色明亮宇宙爆炸现象,被称作“高...
机器人亮相京西古稻田,海淀上庄... 新京报讯(记者吴为)5月10日,海淀区上庄镇2026年“稻香花海”品牌推广季暨邻里节活动在该镇京西稻...
能源保算力、算力强能源,四部门... 算力与电力正在从传统的供需关系,演变为更深层的系统耦合。 国家能源局等四部门日前联合印发《关于促进人...
拖拉机也能无人驾驶?北京科博会... 5月9日,在第28届北京科技博览会上,海淀区上地街道携人工智能代表性企业集中亮相,打造超五百平方米沉...
山东航弘智能科技取得低噪音轴流... 国家知识产权局信息显示,山东航弘智能科技有限公司取得一项名为“一种低噪音的轴流风机”的专利,授权公告...
两台Figure AI人形机器... IT之家 5 月 9 日消息,当地时间 5 月 8 日,Figure AI 公布了一段视频:两台人形...
科技 | 全国首支交管机器人中... “我想去西湖文化广场,该怎么走?” “您可以在武林广场站乘坐地铁1号线或3号线。根据具体想去的位置,...
原创 1... 今年10000mAh容量的手机会越来越多,估计到年底之前,最少还会新增五六款,到时候各家都有相应的机...