百度最新开源一款轻量化模型 适用于学术科研等长文本推理场景
创始人
2025-09-09 18:21:22
0

在9月9日举行的WAVE SUMMIT深度学习开发者大会2025现场,百度正式开源最新的思考ERNIE-4.5-21B-A3B-Thinking。据悉,该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

上证报中国证券网讯(记者 刘暄)在9月9日举行的WAVE SUMMIT深度学习开发者大会2025现场,百度正式开源最新的思考ERNIE-4.5-21B-A3B-Thinking。据悉,该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

据介绍,ERNIE-4.5-21B-A3B-Thinking采用了混合专家(MoE)架构,总参数规模达210亿,每个token激活 30 亿参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking是在ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,该模型支持128 的上下文窗口,适用于需要长上下文的复杂推理任务。

此外,ERNIE-4.5-21B-A3B-Thinking 模型以Apache License 2.0协议开源,允许商业使用。该模型已在HuggingFace、星河社区等主流开源社区同步发布,FastDeploy、 vLLM、Transformers 等开源工具已经实现了对该模型的支持,可以直接加载模型并使用。

公开资料显示,今年6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。目前,文心开源系列模型已在行业中得到广泛应用。

当日,百度还正式发布文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有大幅提升。目前,用户可以在文心一言官网、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上线百度智能云千帆平台,对企业客户及开发者全面开放使用。

相关内容

热门资讯

微电生理两款产品获欧盟医疗器械... 上证报中国证券网讯 2月10日,微电生理发布公告,公司磁导航消融导管及星型高密度标测导管于近日获得欧...
致癌物超标!这种一次性杯子赶紧... 近些年,可降解一次性杯子由于环保、洁净的理念,呈现出快速增长的消费趋势。但有消费者反映,市场上一次性...
北京友谊医院顺利完成首例机器人... 经观健康 2月4日,北京友谊医院顺义院区心内科顺利完成首例机器人(血管介入手术控制系统)辅助下经皮...
光盘录制时代落幕!索尼宣布全面... 界面新闻记者 | 宋佳楠 界面新闻获悉,当地时间2月9日,蓝光光盘标准的核心开创者索尼在其官网发布...
连接价值,赋能生态:东湖大数据... 近日,在北京国际大数据交易所召开的2025年度生态合作伙伴表彰大会上,东湖大数据凭借其在数据要素流通...
关于美团和京东抢叮咚这件事,我... 文|最话FunTalk 王芳洁 叮咚买菜的绣球终于抛给了美团。 2月5日傍晚,美团发布公告称,将以...
内存价格飞涨,技术人员发现家中... 内存价格的持续上涨催生了一个有趣的现象:技术人员开始思考自己在家庭实验室或抽屉里存放的内存条是否能让...
当用户薅完羊毛 产品本身才是留... □丁新科 近日,互联网企业推广AI应用而掀起的“红包大战”牵动人心,有的请新用户1分钱喝奶茶,有的即...
穹彻智能完成数亿元A轮融资 2月10日,澎湃新闻记者获悉,具身智能企业穹彻智能于近日完成数亿元A轮融资。本轮融资由C资本领投,S...
第1视点|今天的科创成果 明日... 9日上午,习近平总书记来到位于北京亦庄的国家信创园,了解信息技术应用创新和北京加快建设国际科技创新中...