蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

欧冠节能技术取得箱体式烘干机专... 国家知识产权局信息显示,东莞市欧冠节能技术开发有限公司取得一项名为“一种箱体式烘干机”的专利,授权公...
易点云携手英特尔打造自研产品,... 近日,易点云正式启用与全球科技领导者英特尔(Intel)联合打造的自研产品展台,首次完整展出其基于真...
嫦娥六号月球样品中首次发现天然... 记者1月20日从国家航天局获悉,吉林大学科研团队近日通过对嫦娥六号月壤样品的系统分析,在国际上首次发...
玖物智能取得密封仓门及过渡仓专... 国家知识产权局信息显示,苏州玖物智能科技股份有限公司取得一项名为“一种密封仓门及过渡仓”的专利,授权...
深圳打造科技零售新地标 逛街逛... 近期,多家科技类店铺落地深圳,这座稳居“中国智造”前列的城市正在打造沉浸式零售消费新场景,将前沿科技...
上海拓必得工具总经理邹云志受邀... 近日,在北京大学对外交流中心举办的《新媒体IP与AI研修班》聚焦新媒体IP打造与AI技术的商业应用,...
提升园区管理效率的创新软件解决... 园区管理软件是现代园区运营的重要工具,它通过整合各项功能,帮助管理者高效进行资源配置和流程优化。软件...
“中国速度”点亮世界AI版图 人工智能(AI)企业密集登陆资本市场,胰腺癌筛查AI模型引外媒关注,国产算力底座训练模型登顶国际开源...
科技赋能春运护航,湛江首次启用... 1月19日,湛江海事部门首次启用自动起降机巢无人机对徐闻港、粤海铁北港等核心水域开展夜间巡航,以科技...
苏州宁虹电子取得浸胶PCB板晾... 国家知识产权局信息显示,苏州宁虹电子科技有限公司取得一项名为“一种浸胶PCB板晾干架”的专利,授权公...