蚂蚁回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
创始人
2025-03-25 07:21:29
0

IT之家 3 月 24 日消息,据新浪科技报道,针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经取得一定进展,也将逐步通过开源分享。

IT之家附事件背景:

近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》,宣布推出两款不同规模的 MoE (混合专家)大语言模型 —— 百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),并提出一系列创新方法,实现在低性能硬件上高效训练大模型,显著降低成本

百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。

相关内容

热门资讯

把代码写进农田 浙江湖州“硬核... 湖州5月22日电(奚金燕 吴珏)在浙江湖州,一场以“硬核科创”为底色的青年入乡实验,正在南太湖新区悄...
神二十三乘组在轨期间将新开展1... 今天(5月23日)上午,神舟二十三号载人飞行任务新闻发布会在酒泉卫星发射中心召开。发言人介绍,按计划...
原创 手... 千元机价格低廉,销量远超旗舰手机,尤其是那些配置高,性能强的高性价比千元机,远比旗舰更受欢迎。 每月...
马上评|共建数智人文湾区更好讲... 当人工智能像水电一样渗透进生活的每个角落,一个严肃的问题浮出水面——在算力越来越强、算法越来越“懂你...
航天员黎家盈作为载荷专家 目前... 今天(5月23日)上午,神舟二十三号载人飞行任务新闻发布会在酒泉卫星发射中心召开。 发言人介绍,飞行...
“我的声音被偷了,小偷却年入百... 小鱼从未想过,自己的声音,会被一个陌生人放到网上明码标价——688 永久使用。 他以这种悲剧的形式,...
美“星舰”飞船完成第12次试飞... △第二级“星舰”飞船溅落前一瞬 当地时间5月22日,美国太空探索技术公司在其官方社交媒体账号上发文称...
保定高新区:工业品直播助力高新... “现在起飞的是复合翼工业无人机,可执行电力巡检、应急搜救、物资投送等任务……”近日,在天峋创新(保定...
新技术首秀!桂东公路用“共振巧... 近日,梧州市长洲区 S304 线龙顶至莲塘村路口段公路改建工程顺利完工。该项目在桂东地区首次应用梁式...
中船上船院自主研制第二代BLS... 上证报中国证券网讯(记者 王文嫣)近日,中船集团上海船舶研究设计院(SDARI,下称“上船院”)自主...