蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

消息人士:OpenAI与Ant... 来源:环球市场播报 据知情人士透露,OpenAI和Anthropic分别与私募股权公司成立的合资企...
苹果正考虑与英特尔和三星合作 ... 【CNMO科技新闻】5月5日,据彭博报道,苹果正就委托英特尔和三星生产其主要设备芯片进行了初步探讨。...
原创 实... #iPhone18Pro 渲染图再曝 #,这次应该准确了5 月 4 日,外媒 notebookche...
原创 偷... 别抱侥幸!浏览成人网站,这些坑躲不掉 说实话,别装糊涂、别耍小聪明。很多人趁独处或摸鱼时,偷偷刷成人...
原创 1... 随着应用、游戏不断升级,对内存与存储的占用逐步提升,所以各大品牌不断增加双存。仅内存方面,最高发展到...
机器人“祖师爷”波士顿动力深陷... 在人形机器人赛道,波士顿动力一直是神坛级存在。1992年从MIT拆分诞生,靠Atlas人形机器人、S...
高通“二把手”跳槽英特尔! 当地时间5月4日,处理器大厂英特尔宣布,高通技术公司前执行副总裁兼移动、计算和扩展现实(XR)业务集...
原创 热... 从最初在Facebook上流传的5G带有病毒的谣言,到后来的孟晚舟事件被污蔑抹黑,我们可以看到,当阴...
5G赋能 智慧织网 ——中国移... 央广网运城4月30日消息(记者张洁 通讯员刘齐)交通是城市的动脉,也是经济发展的先行官。中国移动山西...
从洽谈到揭牌仅用一个月,爱奇艺... 4月29日,位于光谷交通大厦的爱奇艺AIGC(武汉)创意中心正式揭牌。这是继武汉爱奇艺乐园之后,爱奇...