蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

国家安全部:“高端局”可别出现... 当前以人工智能为代表的新技术的发展和应用正呈井喷之势。前沿科技的浪潮正以前所未有的力量改变社会形态。...
全国人大代表张巧良:AI时代要... 全国人大代表、山东康桥律师事务所首席合伙人张巧良建议,在人工智能时代,要深化中小学逻辑教育、全面提升...
美格智能发布行业首款低轨宽带卫... IT之家 3 月 6 日消息,美格智能今日发文,宣布在 MWC26 巴塞罗那期间发布了行业首款低轨宽...
仅存活约2个月,微软Copil... IT之家 3 月 6 日消息,科技媒体 Windows Latest 昨日(3 月 5 日)发布博文...
中德利科技取得光缆连接装置专利... 国家知识产权局信息显示,深圳市中德利科技有限公司取得一项名为“一种光缆连接装置”的专利,授权公告号C...
3月6日精选热点:6G机器人正... 1、机器人:6G机器人”亮相,有望在2029商业化落地 北京社科院副研究员王鹏接受界面新闻采访时表示...
佛坪县开展全国爱耳日系列活动 ... 在第27个全国“爱耳日”来临之际,为普及听力健康知识,加强听力残疾预防,佛坪县开展系列宣传服务活动,...
飞亚达获得实用新型专利授权:“... 证券之星消息,根据天眼查APP数据显示飞亚达(000026)新获得一项实用新型专利授权,专利名为“一...
刘永好委员:破除转型焦虑 传统... 中国日报2月25日电(记者 李静)今年全国两会期间,人工智能赋能实体经济、传统产业转型升级成为热议话...
原创 3... 刚被马斯克夸完,阿里千问的“灵魂人物”辞职了。 作者 | 孙梦圆 编辑丨于婞 来源 | 野马财经 3...