百度最新开源一款轻量化模型 适用于学术科研等长文本推理场景
创始人
2025-09-09 18:21:22
0

在9月9日举行的WAVE SUMMIT深度学习开发者大会2025现场,百度正式开源最新的思考ERNIE-4.5-21B-A3B-Thinking。据悉,该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

上证报中国证券网讯(记者 刘暄)在9月9日举行的WAVE SUMMIT深度学习开发者大会2025现场,百度正式开源最新的思考ERNIE-4.5-21B-A3B-Thinking。据悉,该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

据介绍,ERNIE-4.5-21B-A3B-Thinking采用了混合专家(MoE)架构,总参数规模达210亿,每个token激活 30 亿参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking是在ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,该模型支持128 的上下文窗口,适用于需要长上下文的复杂推理任务。

此外,ERNIE-4.5-21B-A3B-Thinking 模型以Apache License 2.0协议开源,允许商业使用。该模型已在HuggingFace、星河社区等主流开源社区同步发布,FastDeploy、 vLLM、Transformers 等开源工具已经实现了对该模型的支持,可以直接加载模型并使用。

公开资料显示,今年6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。目前,文心开源系列模型已在行业中得到广泛应用。

当日,百度还正式发布文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有大幅提升。目前,用户可以在文心一言官网、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上线百度智能云千帆平台,对企业客户及开发者全面开放使用。

相关内容

热门资讯

国家数据局:“数据要素×”行动... 【国家数据局:“数据要素×”行动推动数据基础设施建设运营加快】财联社5月23日电,从国家数据局了解到...
原创 除... 据新加坡联合早报5月21日报道,被视为欧洲科技界领军人物之一的荷兰光刻机巨头阿斯麦(ASML)首席执...
京东工业发布AI智采管家 助力... 当前,新一轮科技革命与产业变革加速演进,人工智能正成为推动中国工业转型升级的核心引擎。长期以来,中小...
把代码写进农田 浙江湖州“硬核... 湖州5月22日电(奚金燕 吴珏)在浙江湖州,一场以“硬核科创”为底色的青年入乡实验,正在南太湖新区悄...
神二十三乘组在轨期间将新开展1... 今天(5月23日)上午,神舟二十三号载人飞行任务新闻发布会在酒泉卫星发射中心召开。发言人介绍,按计划...
原创 手... 千元机价格低廉,销量远超旗舰手机,尤其是那些配置高,性能强的高性价比千元机,远比旗舰更受欢迎。 每月...
马上评|共建数智人文湾区更好讲... 当人工智能像水电一样渗透进生活的每个角落,一个严肃的问题浮出水面——在算力越来越强、算法越来越“懂你...
航天员黎家盈作为载荷专家 目前... 今天(5月23日)上午,神舟二十三号载人飞行任务新闻发布会在酒泉卫星发射中心召开。 发言人介绍,飞行...
“我的声音被偷了,小偷却年入百... 小鱼从未想过,自己的声音,会被一个陌生人放到网上明码标价——688 永久使用。 他以这种悲剧的形式,...
美“星舰”飞船完成第12次试飞... △第二级“星舰”飞船溅落前一瞬 当地时间5月22日,美国太空探索技术公司在其官方社交媒体账号上发文称...