蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

原创 马... 什么?马斯克要往天上撒一百万颗“电脑”,这事儿有多离谱? 看到新闻的那一刻,笔者差点把咖啡喷出来,马...
迪艾智控取得快插结构专利,极大... 国家知识产权局信息显示,浙江迪艾智控科技股份有限公司取得一项名为“一种快插结构”的专利,授权公告号C...
海淀人工智能教育庙会开启,全区... 新京报讯(记者杨菲菲)“好玩有意思”“挺长见识的”“机器人弹钢琴弹得很好”……1月31日上午,在北京...
陕北高维农场的“三道鬼门关”:... 在“米脂小米密码学宇宙”中,最神秘、最硬核的地方,莫过于那座“陕北高维示范农场”。 这座农场,是被...
“眨眨眼”就能操控轮椅?对话龙... 搜狐科技《思想大爆炸——对话科学家》栏目第146期,对话青岛大学物理科学学院先进纳米纤维创新研究院院...
元启芯申请数据路由方法专利,降... 国家知识产权局信息显示,元启芯(山东)半导体技术有限公司申请一项名为“数据路由方法、装置、电子设备及...
撒金10亿,元宝就能弯道超车? 红包过后,用户能留存多少? 听筒Tech(ID:tingtongtech)原创 文 | 杨 林...
全国所有乡镇及95%的行政村已... 央视网消息(新闻联播):2025年,我国加快农村及偏远地区信息基础设施建设,全国所有乡镇及95%的行...
长沙工业自动化维修优选晨骏科技... 在工业自动化快速发展的今天,设备运行的稳定性与效率直接关系到企业的生产效益。长沙市晨骏自动化科技有限...
抖音视界申请数据处理方法专利,... 国家知识产权局信息显示,抖音视界有限公司申请一项名为“数据处理方法、装置、设备、计算机可读存储介质及...