蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

电商&互联网“风向标”... 2025年,网经社电子商务研究中心作为国家发改委认定“一带一路”TOP10影响力社会智库,已走过18...
今年首个航天IPO敲钟了,电科... 今年第一个航天IPO来了。 投资界获悉,今日(2月10日),中电科蓝天科技股份有限公司(简称“电科蓝...
原创 中... 2月10日,爱芯元智半导体股份有限公司(以下简称“爱芯元智”)正式在港交所主板上市,成为“边缘AI芯...
盐城市盐都区科协开展“世界无线... 为充实青少年的寒假生活,激发科学探索热情,提升青少年科学素养与动手实践能力,2月7日下午,江苏省盐城...
华为申请通信方法和装置专利,有... 国家知识产权局信息显示,华为技术有限公司申请一项名为“一种通信方法和装置”的专利,公开号CN1214...
人类首次!中国天关卫星或捕捉到... 来源:中国新闻网 作为宇宙中引力极其强大、连光都无法逃脱的致密天体,黑洞是如何吞噬周边天体的?其“进...
上海九方云以AI技术重构金融服... 在技术迭代加速的当下,金融业与数字技术的交汇正在重新定义行业运作模式。上海九方云智能科技有限公司(以...
原创 比... 印度月船四号又来新消息了,其印度2026年月球与行星科学会议(LPSC 2026)摘要文件显示,已经...
活动回顾|一颗会“走路”的豆子... 2月7日上午,威海市图书馆少儿馆四楼多功能厅里,充满了“哇!”“原来是这样!”的欢呼和笑声。齿轮儿童...
AI智能体技术赋能传统餐饮,G... 当前沿的AI智能体技术遇见传统的重庆小面产业,将产生怎样的化学反应?在第三届重庆小面(粉)品牌发展大...