蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

老干妈回应“味道变了” 近日,“老干妈为节省成本味道变了”的话题引发网友热议。有消费者反映老干妈味道变了,还有消费者吐槽豆豉...
马上评丨“二次放号”莫将隐患留... “刚换的手机号,我在注册网盘账号时,直接进入了陌生人的账号,里面有别人的家庭照片、工作文档,甚至还有...
吉林省农工巧匠邢凤娥|“红薯大... 专栏 科技之冬,匠心闪耀 科技之冬暖黑土,匠心灼灼耀四平。 恰逢“科技之冬”赋能乡村振兴之时,市科协...
红魔11 Air外观细节公布:... 当iPhone进军Air手机赛道之后,轻薄再次成为业界讨论的焦点,这段时间以来,已经有多家品牌加入到...
国内首个农业开源大语言模型“司... 科技日报南京1月13日电 (记者金凤)13日,记者从南京农业大学获悉,该校主导研发出国内首个面向通用...
国企科技创新与产业创新到底如何... 知风云:在全球科技竞争日趋激烈、产业变革加速演进的今天,科技创新与产业创新的深度融合,已成为中国经济...
数智赋能下文博资源活化利用与跨... (来源:天津日报) 转自:天津日报 党的二十大报告明确提出“实施国家文化数字化战略”,这为文博事业的...
“数字温情”能否抵御孤独 ■ 杨璇 近日,“死了么”App意外走红。1月13日团队宣布即将发布新版本,启用全球化品牌名Demu...
别再乱下载了!这神器让手机秒变... 在信息过载而注意力稀缺的今天,你是否希望有一款装在口袋里的免费AI助手,能随时帮你高效产出高质量文章...
浙江环驱科技取得可加工小模数滚... 国家知识产权局信息显示,浙江环驱科技有限公司取得一项名为“一种可加工小模数的滚齿夹具”的专利,授权公...