百度最新开源一款轻量化模型 适用于学术科研等长文本推理场景
创始人
2025-09-09 18:21:22
0

在9月9日举行的WAVE SUMMIT深度学习开发者大会2025现场,百度正式开源最新的思考ERNIE-4.5-21B-A3B-Thinking。据悉,该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

上证报中国证券网讯(记者 刘暄)在9月9日举行的WAVE SUMMIT深度学习开发者大会2025现场,百度正式开源最新的思考ERNIE-4.5-21B-A3B-Thinking。据悉,该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

据介绍,ERNIE-4.5-21B-A3B-Thinking采用了混合专家(MoE)架构,总参数规模达210亿,每个token激活 30 亿参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking是在ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,该模型支持128 的上下文窗口,适用于需要长上下文的复杂推理任务。

此外,ERNIE-4.5-21B-A3B-Thinking 模型以Apache License 2.0协议开源,允许商业使用。该模型已在HuggingFace、星河社区等主流开源社区同步发布,FastDeploy、 vLLM、Transformers 等开源工具已经实现了对该模型的支持,可以直接加载模型并使用。

公开资料显示,今年6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。目前,文心开源系列模型已在行业中得到广泛应用。

当日,百度还正式发布文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有大幅提升。目前,用户可以在文心一言官网、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上线百度智能云千帆平台,对企业客户及开发者全面开放使用。

相关内容

热门资讯

量子计算机千比特测控系统出货!... 工业和信息化部表示,“十五五”时期将聚焦量子科技等领域,加强技术攻关、企业培育。当前量子科技作为新一...
乘数智“快车”,山东移动助力潍... 晨光刚漫过潍河的堤岸,安丘河洼村的田埂上就多了个熟悉的身影。山东移动潍坊分公司驻村第一书记田洪涛踩着...
从街边推车到年销十亿!湖北非遗... 极目新闻记者 赵贝 一台1996年5月24日出摊的小推车,30年来已成为小胡鸭企业文化的精神“化身”...
存储产业链扩产潮涌 多家公司积... 本报记者 丁蓉 当下,全球存储器市场迎来“超级周期”,产业链上下游亦同步吹响扩产号角。中关村物联网产...
【中证快报】1月12日中证投资... 【中证头条】 力鸿一号飞行器完成亚轨道飞行试验任务 --------- 1月12日,中科宇航力鸿一号...
AI医疗如何“下基层”? 应用... AI医疗如何“下基层”? 【场景创新面面观】 人工智能(AI)辅助解读患者影像资料,外骨骼机器人帮助...
中部第一城,何以卡位“第三极”... 每经记者|淡忠奎 每经编辑|刘艳美 商业航天概念持续火爆。1月12日,卫星ETF、卫星ETF易方达...
【市场观潮】数字人直播,别让带... 来源:滚动播报 (来源:工人日报) 近日,市场监管总局、国家网信办联合印发《直播电商监督管理办法》(...
自治区碳排放计量实现“精算” ... 近日,两只基于智能物联电表架构的新型“电碳表”在乌兰察布市两家重点用电企业完成安装调试并正式运行,标...
厦门小程序开发性价比高厂家 厦门小程序开发市场:技术演进与高性价比实践路径分析 行业痛点分析 当前,厦门软件公司在承接小程序开...