蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

多项在轨工作稳步推进 神二十一... 神舟二十一号乘组航天员张陆、武飞、张洪章在轨工作已近80天。上周,多项在轨工作稳步推进,三位航天员工...
日跃模塑取得滑块抽芯机构及注塑... 国家知识产权局信息显示,宁波日跃模塑有限公司取得一项名为“一种滑块抽芯机构及注塑模具”的专利,授权公...
麻六记探索健康转型新路径 计划... 中国网财经1月18日讯 1月16日,由北京市通州区潞城镇人民政府主办的“城市副中心食品健康产业高质量...
山东捷远取得变压器加工用烤漆装... 国家知识产权局信息显示,山东捷远变压器有限公司取得一项名为“一种变压器加工用烤漆装置”的专利,授权公...
AI也能点外卖、买东西、订机票... 东方网记者1月15日报道: 人工智能(AI)正从“空中楼阁”加速坠入烟火生活。今日,千问App宣布重...
东方社区数字苑打通少儿科创普及... 东方网记者曹磊1月18日报道:少年强则国强,科技启蒙是点亮少年探索之心的关键。在数字化转型的浪潮中,...
从“会种地”到“慧种地”:银川... 央广网银川1月18日消息(记者吴佳仪)寒冬时节,宁夏银川却别有一番“暖”意。在兴庆区掌政镇的温室大棚...
沃尔玛与小红书达成深度合作 首... 来源:市场资讯 (来源:环球网资讯) 来源:环球网 【环球网科技报道 记者 李文瑶】1月16日,沃尔...
统计课堂:什么是统计数据的报告... 在分析统计指标变动情况时,我们常常需要将一个时期的量与另一个时期的量进行对比,比如用2023年的国内...
松下万宝取得带弯管组件的卧式压... 国家知识产权局信息显示,松下.万宝(广州)压缩机有限公司取得一项名为“一种带弯管组件的卧式压缩机”的...