蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

孩子能不能用AI?千问APP教... 1月21日下午,阿里巴巴集团旗下千问APP举办《孩子到底能不能用AI》研讨会。多位来自教育界、社会学...
腾讯李强:AI是一场马拉松,下... 来源:新浪科技 新浪科技讯 1月22日下午消息,在2026腾讯云合作伙伴大会上,腾讯集团副总裁、政企...
韩国正式施行人工智能领域综合性... 新华社首尔1月22日电(记者黄昕欣)为促进人工智能(AI)领域健康发展,韩国自22日起正式施行《关于...
“永不落幕的科普月”2026年... 永不落幕的科普月 2026年第1期 正式开启 为打造长期性和品牌性科普活动,1月14日,“永不落幕的...
索菲丝全国首发“匠心智脑”AI... 本报讯 (记者金婉霞)1月21日,索菲丝智能科技(上海)有限公司(以下简称“索菲丝”)在上海举办了以...
中国建设银行申请多渠道问卷生成... 国家知识产权局信息显示,中国建设银行股份有限公司、建信金融科技有限责任公司申请一项名为“多渠道问卷生...
中国星网换帅增资 冲刺星座部署... 记者 王雅洁 2026年1月20日,经济观察报从中国卫星网络集团有限公司(下称“中国星网”)获悉,其...
我国科学家成功研制“纤维芯片” 记者从复旦大学获悉,该校科研人员通过设计新型架构,率先在柔软、富有弹性的高分子纤维内实现了大规模集成...
智联招聘报告:算法工程师平均招... 在新科技浪潮与产业结构升级的共同推动下,新质生产力领域人才需求持续爆发,成为就业市场的“增长极”。智...
AI技术赋能基层,大鹏新区绘就... 深圳新闻网2026年1月22日讯(记者 周维朕)“没想到在家门口就能学会用AI做短视频推广民宿,现在...