计算机|DeepSeek:下一代模型展望
创始人
2026-04-01 11:03:34
0

来源:中信证券研究

文|杨泽原 丁奇 潘儒琛 马庆刘

2026年以来,国产大模型厂商聚焦Agent及代码能力升级,竞相发布新模型。我们认为即将发布的DeepSeek下一代新模型有望延续高性价比开源模型路线,在能力上实现更强记忆功能与超长上下文处理,精进代码、Agent能力的同时并补齐多模态短板,带来模型原厂、AI应用、AI 基础设施方向的新投资机遇。

▍代码、Agent、原生多模态:全球大模型的升级方向。

AI编程领域,训练框架升级、采用完整代码仓库及工程轨迹作为训练数据、引入多步执行与自我修复的更深思维链,造就了AI Coding从代码补齐工具走到项目级别自主智能体,Harness Engineer有望促使技术人员定位从代码工程师走向使AI发挥最大效能的Agent管理者。多Agent集群领域,现象级产品OpenClaw充分展现多Agent系统潜力,智谱、MiniMax、腾讯、Kimi等国内厂商均推出了“类龙虾”产品,释放数字员工生产力。原生多模态领域,原生多模态架构已成主流方向,混合嵌入编码快速突破,国内模型在实时音视频交互以及跨模态连续推理等关键环节仍亟待突破。

▍国产大模型:密集迭代升级,能力持续突破。

1)MiniMax:代码能力进一步升级,M2.7 SWE-Pro测试得分56.22%,超越Gemini 3.1 Pro;在实现端到端完整项目交付场景VIBE-Pro测试中得分55.6%,比肩Claude Opus 4.6,对软件系统的运行逻辑理解进一步增强。同时M2系列模型在RL等场景参与M2.7训练过程,实现模型自我迭代。

2)智谱:GLM-5引入DSA并自研“Slime”架构,能够以极少的人工干预自主完成Agentic长程规划与执行、后端重构和深度调试等系统工程任务,在工具调用和多步骤任务执行(MCP-Atlas 67.8%)、联网检索与信息理解(Browse Comp 89.7%)能力接近甚至超过海外领先模型水平。

3)Kimi:Kimi 2.5引入了视觉能力自动拆解交互逻辑、复现代码,新推出Agent集群模式,在HLE-Full、BrowseComp、DeepSearchQA等智能体应用测试集中得到对标GPT-5.2、Claude 4.5 Opus、Gemini 3 Pro的分数,Moonshoot采用降价策略,API价格相比K2 Turbo定价降低30%以上。

4)小米:Xiaomi MiMo-V2-Pro在ClawEval、t2-bench等衡量模型Agent调用能力的测试集中接近甚至领先部分海外头部模型,其早期内部测试版本以Hunter Alpha 的匿名代号上线OpenRouter,上线期间多天登顶调用量日榜。我们看好大模型底座赋能小米人车家全生态,实现AI能力跃升。

▍DeepSeek展望:延续高性价比路线,精进长文本、代码、Agent、多模态能力。

DeepSeek在26年1月发布的DeepSeek V3.2采用稀疏注意力(DSA)+混合专家(MoE)架构,实现训练、推理的提效降本,输入/输出token定价分别下降60%/75%,同时代码、多Agent能力BenchMark得分显著提升。结合DeepSeek模型进化方向及梁文峰参与署名的Engram模块论文,我们认为DeepSeek V4.0等新一代模型有望将Engram融入已成熟的DSA+MoE架构,通过分层存储关键常用信息实现Transformer架构中注意力层计算量的指数级下降,进而实现超长上下文处理,提升模型效率的同时精进代码、Agent能力,补齐多模态短板。

▍风险因素:

AI核心技术发展、应用拓展不及预期,算力降本不及预期,AI被不当使用造成严重社会影响,数据安全风险,信息安全风险,行业竞争加剧。

▍投资策略:我们建议关注以下三条投资主线。

1)模型原厂:DeepSeek新一代模型有望与其他国产模型携手,驱动中国AI加速走向世界,同时模型训推进一步降本,更廉价的tokens驱动全球大模型API调用量整体增加。

2)AI应用:模型平权有助于缓解市场对于模型与应用矛盾叙事带来的焦虑,助力千行百业AI Agent落地,利好有壁垒的AI应用公司;

3)AI基础设施:降本带来用量增长使AI Infra受益,国产AI Infra与国产模型相向而行。

相关内容

热门资讯

iPhone 18 Pro屏幕... 【太平洋科技快讯】3 月 31 日,多位消息人士曝光疑似 iPhone 18 Pro 系列的屏幕盖板...
上海玖鹏智慧能源申请电缆拆解用... 国家知识产权局信息显示,上海玖鹏智慧能源技术有限公司申请一项名为“一种电缆拆解用电缆输送装置”的专利...
“谄媚式”AI悄悄改变你的认知... 来源:星沙时报 来源:科技日报 当你向人工智能(AI)倾诉个人烦恼或寻求人际交往建议时,它给出的回应...
首颗“雄安造”卫星“雄安一号”... 空天信息和卫星互联网是雄安新区重点培育的三大主导产业之一,其中的空天信息和卫星互联网产业更是新区未来...
谷歌警告:量子威胁比预期提前,... 谷歌不仅负责互联网大量通信的加密工作,同时也在构建自己的量子计算机,因此该公司在评估这项技术的成熟程...
美国宣布:4月2日重返月球!尴... 北京时间4月2日清晨,美国国家航空航天局(NASA)将迎来一个重要时刻—阿尔忒弥斯2号载人绕月任务计...
库克谈苹果50周年:苹果依旧是... 快科技4月1日消息,在苹果公司迎来50周年之际,CEO库克近日接受专访,回顾了与乔布斯共事的岁月。 ...
创耀取得铝锭切割装置专利,实现... 国家知识产权局信息显示,创耀(天津)建筑装饰材料有限公司取得一项名为“一种铝锭切割装置”的专利,授权...
华沿机器人港股超购逾5059倍... 3月30日,华沿机器人(1021.HK)正式登陆港交所。上市首日,公司股价低开高走,盘中一度涨超25...
全球大型数据中心产生“热岛效应... 来源:环球时报 本报特约记者 陈 山 随着全球人工智能(AI)的高速发展,对于大型数据中心的需求持续...