百度最新开源一款轻量化模型 适用于学术科研等长文本推理场景
创始人
2025-09-09 18:21:22
0

在9月9日举行的WAVE SUMMIT深度学习开发者大会2025现场,百度正式开源最新的思考ERNIE-4.5-21B-A3B-Thinking。据悉,该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

上证报中国证券网讯(记者 刘暄)在9月9日举行的WAVE SUMMIT深度学习开发者大会2025现场,百度正式开源最新的思考ERNIE-4.5-21B-A3B-Thinking。据悉,该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

据介绍,ERNIE-4.5-21B-A3B-Thinking采用了混合专家(MoE)架构,总参数规模达210亿,每个token激活 30 亿参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking是在ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,该模型支持128 的上下文窗口,适用于需要长上下文的复杂推理任务。

此外,ERNIE-4.5-21B-A3B-Thinking 模型以Apache License 2.0协议开源,允许商业使用。该模型已在HuggingFace、星河社区等主流开源社区同步发布,FastDeploy、 vLLM、Transformers 等开源工具已经实现了对该模型的支持,可以直接加载模型并使用。

公开资料显示,今年6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。目前,文心开源系列模型已在行业中得到广泛应用。

当日,百度还正式发布文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有大幅提升。目前,用户可以在文心一言官网、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上线百度智能云千帆平台,对企业客户及开发者全面开放使用。

相关内容

热门资讯

原创 英... 2026年刚开年,航天圈就热闹得不行。前两天NASA刚放话,说“阿耳忒弥斯2号”载人绕月任务的时间表...
微软警告:网络威胁组织正越来越... IT之家 3 月 8 日消息,微软表示,网络威胁组织正越来越多地在其行动中运用人工智能,以加快攻击速...
【航空视界】转载:全球首款混合... 2月1日,由中国航天科技集团十一院研制的彩虹YH-1000S,全球首款混合动力无人运输机在重庆梁平首...
全国人大代表王俊峰:强化基础研... 来源:中国工业报 中国工业报记者 霍悦 当前,我国正处于从制造大国迈向制造强国的关键关口。作为制造业...
欧洲航天局:“危险小行星”20... IT之家 3 月 8 日消息,去年 3 月,科学家曾得知 2024 YR4 小行星在未来七年内有 3...
龙华企业组团出海 “龙华智造”... 龙华区企业组团出海全球移动通信领域顶级盛会——2026世界移动通信大会,15家龙华优质企业组团参展,...
坚定信心 勇挑大梁丨邯郸市钢铁... (来源:邯郸网络广播电视台) 转自:邯郸网络广播电视台 从依靠经验“看火炼钢”,到数据驱动“一键出...
原创 油... 兄弟们,油价又要大涨了! 据最新信息透露:新一轮成品油调价窗口将于3月9日24时开启,3月6日,布...
三八节送礼推荐!21天超长续航... 每到3月8日前后,关于“女性成长”与“爱自己”的话题总能引起无数共鸣。对于当代的女生来说,三八妇女节...
展知电器取得防倾倒电热油汀专利... 国家知识产权局信息显示,宁波展知电器有限公司取得一项名为“一种防倾倒的电热油汀”的专利,授权公告号C...