蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

英伟达与SK海力士宣布多年期技... 【英伟达与SK海力士宣布多年期技术合作 共同开发下一代AI内存】财联社6月8日电,英伟达与SK海力士...
原创 2... 一、粉色系手机配件为何成为新宠? 随着苹果18粉色手机的持续热销,与之搭配的粉色系配件市场也迎来爆...
原创 S... 这是全球投资者都无比兴奋的历史性时刻。 随着SpaceX的上市之日不断临近,许多人也越来越兴奋。...
教育科技人才深度融合 红船旁的... 一个设在县级小城的创新平台能有多大发展空间?近日,中青报·中青网记者跟随“牢记初心使命 奋进复兴征程...
抢抓5G机遇,激活产业转型新动... 编者按 加快数字经济与实体经济深度融合,以数智赋能资源型经济转型,是我省立足产业禀赋、培育新质生产力...
中企携智能装备亮相土耳其工程机... 新华社伊斯坦布尔6月6日电(记者王科文 吴瑶)第十八届土耳其国际工程机械、技术及设备贸易展览会3日至...
2026年高考全国 I 卷语文... (一)阅读I 材料一: “今天海况很不好,大家都在晕船。得知入选《自然》年度人物,我还来不及欢喜,因...
校企携手光影筑梦 贵州学子用影... 近日,一部名为《爱你老几》的校园温情微电影在各大短视频平台温情上线。这部影片由贵州师范大学传媒学院携...
机架式POE网络防雷器的选型逻... 一、行业背景:网络设备防雷的复杂性与精细防护需求 在安防监控、智能楼宇、数据中心等场景中,POE(以...
上海海派旗袍月启幕:艺术展演、... 东方网记者项颖知6月7日报道:在上海市妇女联合会、上海市文化和旅游局指导下,由上海市非物质文化遗产保...