蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

物理AI落地的标杆答案,深庭纪... 在AI大模型带来的新一轮“工业革命”下,大众的认知以及产业的迭代方向都被重塑。CES 2026开展前...
湾区启航 重庆加速建设全国人工... 一月十日,南岸区重庆人工智能学院,重庆人工智能湾区建设启动大会在此举行。特约摄影 郭旭\视觉重庆 ...
2026年CES展 “中国智造... 来源:市场资讯 (来源:封面新闻) 封面新闻记者 边雪 巨大的屏幕上,折叠屏手机、未来概念车、跳舞的...
iQOO Neo11好用吗?为... iQOO Neo11自2025年10月底发布以来,就以其 “旗舰配置下沉”的策略引起了广泛关注。它搭...
芯片龙头,修订重大资产重组草案 1月9日晚间,模拟和混合信号芯片龙头晶丰明源公告称,公司于1月9日收到上交所出具的《关于上海晶丰明源...
磁路通取得电磁式除磁机冷却装置... 国家知识产权局信息显示,东莞市磁路通智能装备有限公司取得一项名为“一种电磁式除磁机的冷却装置”的专利...
数码视讯申请视频延时处理方法和... 国家知识产权局信息显示,北京数码视讯技术有限公司申请一项名为“视频延时处理方法和系统”的专利,公开号...
天津华为云服务培训领域标杆:河... 在数字化转型浪潮中,云计算与人工智能技术已成为企业提升竞争力的核心驱动力。天津地区作为北方重要的科技...
原创 芯... 据悉中国台湾最大的芯片封测企业日月光已宣布涨价20%,随着它的涨价,芯片封测将全面涨价,而芯片封测目...
2025年2000元档性能手机... 在竞争激烈的2000元价位段,2025年的性能手机市场迎来新一轮技术下放潮。消费者既希望获得旗舰级流...