蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

实测Windows全新右键菜单... 快科技11月24日消息,微软在最新的Windows 11 Insider Preview Build...
从贵州榕江走出的数学家 原标题:2024年度贵州省科学技术合作奖获得者周家足——从贵州榕江走出的数学家 在今年11月的贵州省...
国内首个商用密码应用成本测算标... 近日,丽水市正式发布《信息系统商用密码应用成本测算指南》(T/LSZX 0012-2025)团体标准...
“实验室”→“生产线” 这些硬... 来源:蝌蚪五线谱 总台央视记者 张丛婧 王利 任鑫玉 邵鑫扬 张小枫 今年是联合国教科文组织定义的“...
加强免密支付安全管理 来源:经济日报 “免密支付功能开通时容易,想要关闭却找不到入口。”针对这类消费者时常面临的问题,近期...
抢滩假日购物季,OpenAI推... OpenAI在推出了一款免费的人工智能购物搜索功能,该功能可为ChatGPT用户生成个性化购买指南,...
原创 i... 换新iPhone后,最头疼的就是数据迁移。其实苹果自带的一键换机功能非常简单,只需三步就能把旧手机里...
沪蒙联合研发,推动新能源重卡发... “一刻钟充满电,重卡即刻上路!”近日,内蒙古一家新能源有限公司负责人张宏宇兴奋地对记者说,这个“高压...
半个月市值蒸发6000亿,富士... 11月24日,富士康科技集团(又称“鸿海科技集团”)控股的A股上市公司工业富联股价遭遇重挫,盘中一度...
机器人产业,正成为传统工厂入局... 来源:滚动播报 (来源:上观新闻) 在日前举行的海智在线第十届全球采购供应链千人会上,一场主题为...