DeepSeek-V3.2-Exp模型正式发布并开源 API大幅度降价
创始人
2025-09-30 14:21:27
0

【环球网科技综合报道】9月29日,据DeepSeek官方消息,DeepSeek-V3.2-Exp大语言模型正式发布并开源。该模型通过引入创新的稀疏Attention架构,在降低计算资源消耗的同时显著提升推理效率,为长序列文本处理提供了更优解决方案。

据官方介绍,DeepSeek-V3.2-Exp 模型是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。

具体来说,DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。据官方称,在新的价格政策下,开发者调用 DeepSeek API 的成本将降低 50% 以上。(青山)

相关内容

热门资讯

上海电信纯流量卡性价比评测,新... 办卡:微 信 公 众 号 搜【 可可 找 卡】,每天更新运营商官方高性价比套餐!帮你精准匹配适配流量...
MuleSoft新增智能体扫描... Salesforce在其集成平台MuleSoft中新增了"智能体扫描器"功能。智能体扫描器是Agen...
亮普智能取得检测气体流量计专利... 国家知识产权局信息显示,山东亮普智能仪表有限公司取得一项名为“一种检测气体的流量计”的专利,授权公告...
星巴克CEO,年薪降了4.5亿... 来源:市场资讯 (来源:21Style) 文丨贺泓源 打工人之间的差距是明显的,尤其在收入上。 星...
谷歌计划将Gmail转变为关系... 作为全球约30亿用户日常生活的中心控制面板,Gmail即将迎来革命性变革。Gmail产品副总裁Bla...
广州创和智能申请自动变道分拔装... 国家知识产权局信息显示,广州创和智能科技有限公司申请一项名为“一种自动变道分拔装置”的专利,公开号C...
小米儿童手表测评:强定位、伴成... 作为一个既要忙工作又要顾孩子的家长,我特别理解那种想随时知道孩子情况的焦虑。之前给孩子买第一块手表时...
什么是“碳足迹”?一文说清 (来源:科普中国) 转自:科普中国 2026年是“十五五”开局之年,正是将宏观“规划图”细化为可行“...
技术分享!wepoker好友助... 技术分享!wepoker好友助力码,川娱竞技血战辅助器,黑科技教程(存在有挂)-哔哩哔哩1、全新机制...
遇见非遗 | 玉溪新平:当“4... 近日,云南省玉溪市新平彝族傣族自治县平甸乡联合县第二幼儿园开展“擂响非遗鼓韵 舞动灿烂童心”省级非物...