蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

石家庄市低空经济产业招商推介会... 5月14日,由石家庄市人民政府主办、市投资促进局承办的低空经济产业招商推介会顺利召开。 此次活动全面...
百度成立“模型委员会”,国内大... 红星资本局5月15日消息,日前百度官宣设置“百度模型委员会”(Baidu Model Committ...
给大国工程做CT!我国首颗能源... 上证报中国证券网讯(记者 王子霖)5月15日,我国首颗能源工程专用SAR卫星“电建一号”顺利进入50...
厘米级精度!宿迁近900公里国... 5月13日,宿迁市公路事业发展中心在324省道开展普通国省道三维测量作业,运用前沿数字化技术为全市普...
山东上线“齐鲁制造会客厅” 勾... 济南5月15日电(记者 孙婷婷)山东打造“齐鲁制造会客厅”系列活动,围绕人工智能、机器人、智能终端、...
IT之家采访联发科:智能体无缝... IT之家 5 月 15 日消息,5 月 13 日,联发科在上海举办了以“全域芯智能,体验新无界”为主...
原创 薪... 当第一缕青烟从枯木摩擦处升起,人类便开启了用化学钥匙解锁能源大门的光辉历程。柴薪作为最古老的能源载体...
济南隆超取得便捷式喷涂装置专利... 国家知识产权局信息显示,济南隆超石油机械锻造有限公司取得一项名为“一种便捷式喷涂装置”的专利,授权公...
原创 中... 光谷国际光电子博览会5月18日一开锣,国家信息光电子创新中心展台前就堵住了——不是为拍展板合影,是真...
镜观东莞・智见未来 | 克里特... AI眼镜产业风口正盛 东莞凭借完整产业链与强大制造能力 稳居全球AI眼镜出货量第一 在东莞凤岗,一家...