2.4万亿参数原生全模态大模型,文心5.0正式版上线
创始人
2026-01-22 13:41:00
0

1月22日,百度发布并上线原生全模态大模型文心5.0正式版。该模型参数达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。目前,个人用户可在文心APP、文心一言官网体验,企业与开发者可通过百度千帆平台进行调用。

在40余项权威基准的综合评测中,文心 5.0 正式版的语言与多模态理解能力超越Gemini-2.5-Pro、GPT-5-High等模型,稳居国际第一梯队。图像与视频生成能力与垂直领域专精模型相当,整体处于全球领先水平。

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍,与业界多数采用“后期融合”的多模态方案不同,文心5.0的技术路线采用统一的自回归架构进行原生全模态建模,将文本、图像、视频、音频等多源数据在同一模型框架中进行联合训练,使得多模态特征在统一架构下充分融合并协同优化,实现原生的全模态统一理解与生成。

此外,文心5.0采用超大规模混合专家结构,具备超稀疏激活参数,激活参数比低于 3%,在保持模型强大能力的同时,有效提升推理效率。同时,基于大规模工具环境,合成长程任务轨迹数据,并采用基于思维链和行动链的端到端多轮强化学习训练,显著提升了模型的智能体和工具调用能力。

得益于原生全模态建模,文心5.0在多模理解、代码、创意写作等能力上实现显著突破。大会现场,仅输入一段博主复刻“活了么”App教程视频,文心5.0便能自动拆解步骤,理解核心交互逻辑,并直接生成可运行的前端代码。在创意写作任务中,还能模拟《红楼梦》中王熙凤的语言风格,生成融合古典语境与现代商业逻辑的“大观园资产重组方案”,展现出较强的情境理解与创作能力。

吴甜现场介绍了“文心导师”计划的最新进展。文心导师队伍持续壮大,目前已吸纳835位来自科技、金融、文化、教育、医疗、能源等十余个重点行业以及数理化生文史哲等学科的专家,在知识传授、鉴赏评价、专业校准方面对大模型进行指导,帮助模型在逻辑严谨性、专业深度、创意质量和价值观对齐等方面不断精进。

有分析认为,文心5.0正式版的上线,意味着原生全模态技术路线逐渐走向成熟与实用,体现了中国模型厂商在多模态大模型底层自主创新能力,有助于进一提升中国AI在全球AI产业竞争中的技术话语权。

据了解,2025年11月,百度发布文心大模型5.0并上线Preview版本。此后,文心5.0系列模型多次登上LMArena全球大模型竞技场,多次位居文本榜和视觉理解榜国内第一,跻身国际第一梯队。1月15日,文心5.0以1460分位列LMArena文本榜国内第一、全球第八,超过GPT-5.1-High、Gemini-2.5-Pro等多款国内外主流模型。

相关内容

热门资讯

AI科学实验室技术实力强的企业... AI科学实验室技术实力强的企业2026推荐,适配多行业需求 在响应国家科技教育战略、推动人工智能教育...
索尼发布True RGB电视技... IT之家 4 月 8 日消息,索尼今天通过其官方 X 账号,正式宣布下一代 Mini LED 电视技...
“机器人同事”,组团上岗! 现在的常州 已经被“智能搭子”全面包围了 🤖🤖🤖 这些“钢铁伙伴”渗透在 常州产业发展、城市运维里的...
美载人绕月飞船开始返回地球之旅 据美国航空航天局消息,执行美国“阿耳忒弥斯2号”载人绕月飞行任务的“猎户座”飞船4月7日开始返回地球...
韩国史上最强单季业绩:三星一季... 文 | 新质动能 这是韩国企业史上最扬眉吐气的一份财报。 2026年4月7日,三星电子发布了202...
消息称智能体业务驱动Perpl... IT之家 4 月 8 日消息,《金融时报》2 小时前报道称,凭借智能体 / 代理业务的良好表现,以其...
九章云极“一度算力”破局算力标... 一款名为OpenClaw的AI智能体迅速引爆开发者圈层,凭借现象级扩散态势成为继DeepSeek之后...
地平线,还没彻底吃到智驾平权的... 作者 | 封华 编辑 | 魏晓 智驾江湖,正迎来更猛烈的厮杀。 2025年,中国乘用车市场智能辅助驾...
原创 7... 文/杨剑勇 大模型无疑是当前最热门的赛道,深受市场追捧。其中,智谱AI虽然巨额亏损,市场仍然对其青睐...
上海市数理医学学会可穿戴医疗设... 4月4日,上海市数理医学学会可穿戴医疗设备专业委员会成立大会暨首届可穿戴技术研讨会,在上海科技大学会...