蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

时创能源获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示时创能源(688429)新获得一项发明专利授权,专利名为“一种...
刚刚,Claude Mytho... 衡宇 Jay 发自 凹非寺 量子位 | 公众号 QbitAI Anthropic遮遮掩掩两个月的“神...
双奖加冕!达实AIoT平台荣获... 2026年6月9日,第十四届阿拉丁神灯奖颁奖盛典于广州隆重举办。达实AIoT智能物联网管控平台荣获“...
永劫无间延迟高怎么解决 手把手... 玩永劫无间出现延迟高,大多和本地网络环境、节点匹配不对有关。 首先排查本地基础问题,先确认你登录的游...
智能眼镜成偷拍“神器”?用算法... 来源:中青评论 让先进的智能技术服务于人,而不是成为伤害他人权利的“武器”。 6月8日,乐奇Roki...
巨网融通!六大新机遇,来了 来源:央视财经 “六张网”,也就是水网、新型电网、算力网、新一代通信网、城市地下管网以及物流网,“六...
发射成功!完成多项工程化技术改... ◎ 科技日报记者 付毅飞 实习生 张城辉 记者从蓝箭航天获悉,6月9日16时23分, 朱雀二号改进型...
回应时代,晶澳做出了选择! 来源:赶碳号科技 当下光伏行业竞争加剧,业内企业纷纷聚焦技术提效、产品迭代与成本压降;与此同时,AI...
不到一个月再出征,朱雀二号运载... 6月9日16时23分,朱雀二号改进型遥六运载火箭(ZQ-2E Y6)在东风商业航天创新试验区点火升空...
原创 一... 2026年6月5日,国际空间站又出事了。 这一天的13时04分(UTC),NASA给空间站发了道急令...