蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

成都新一批“科技副总”上岗破解... 成都5月14日电 (王利文)5月14日,“科创天府·智汇蓉城”成都市“科技副总”选聘(电子信息与人工...
呼吸也会留下DNA身份信息? 记者 张佳欣 空气里究竟藏着多少信息?过去,人们想到的是尘埃、花粉和细菌,如今,科学家发现,空气中还...
中国量子计算再破纪录 中国量子计算再破纪录 揭秘“九章四号”量子计算原型机 4月10日拍摄的“九章四号”量子计算原型机...
强化科技创新加快发展新质生产力 日前,国家电网公司召开工作会议部署当前重点工作,强调要牢牢把握发展新质生产力的要求,抢抓历史机遇,加...
大模型瘦身革命:注意力学会走神... 你知道吗?就在你刷着手机、感叹AI模型怎么越来越“笨重”的同时,大洋彼岸的实验室里,一场关于让大模型...
鹏辉能源全场景电池方案亮相CI... 上证报中国证券网讯(李子健 记者 周亮)在5月13日开幕的第十八届深圳国际电池技术交流会/展览会(C...
分享透视!菠萝辅助器免费版的功... 分享透视!菠萝辅助器免费版的功能介绍!都是存在有辅助教程(有挂详细)-哔哩哔哩1、完成菠萝辅助器免费...
教你透视!智星德州插件2024... 教你透视!智星德州插件2024最新版!原来存在有辅助工具(证实有挂)-哔哩哔哩亲,关键说明,智星德州...
解密透视!pokemomo辅助... 解密透视!pokemomo辅助软件!一直是真的有辅助教程(有挂分享)-哔哩哔哩1)pokemomo辅...
辅助透视!cloudpoker... 您好,cloudpoker怎么开挂这款游戏可以开挂的,确实是有挂的,需要了解加去威信【4852750...