蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

中航光电获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示中航光电(002179)新获得一项发明专利授权,专利名为“一种...
苹果折叠屏入场倒计时,国产头部... 6月26日晚,国内头部手机厂商vivo正式推出年度大折叠旗舰产品vivo X Fold6,起售价79...
新机涨价官翻补位!MacBoo... 快科技6月27日消息,本周四,苹果对MacBook和iPad系列产品的定价进行了调整,其中面向主流市...
谷歌前CEO感叹中国人聪明:不... 快科技6月27日消息,近日,谷歌前首席执行官埃里克·施密特在公开采访中的一段最新表态再度引发全网网友...
Cisco Unified C... 一个Cisco Unified CM严重安全漏洞在补丁发布数周后,目前已遭到攻击者的积极利用。此前,...
宁德时代申请电池单体专利提升极... 国家知识产权局信息显示,宁德时代新能源科技股份有限公司申请一项名为“电池单体、电池装置以及用电装置”...
“人造太阳”重要突破!全球最大... “人造太阳”重要突破!全球最大核聚变堆超导磁体通过验收 核聚变能被写入国家“十五五”规划纲要,并被列...
乐奇Rokid给开发者“原住民... 文 | 智能相对论 作者 | 叶远风 杭州六月的午后,祝铭明骑着一辆摩托车直接开上了Rokid Op...
存储算力日益短缺,谷歌开始探索... 前阵子,在谷歌的协助下,加州大学圣地亚哥分校(UCSD)计划用2000台退役的Pixel手机组合起来...
原创 南... 2026年的春天,南极大陆接连曝出两则震撼全球的消息,让深耕气候研究的各国科学家集体陷入沉默。这片常...