DeepSeek-V3.2-Exp模型正式发布并开源 API大幅度降价
创始人
2025-09-30 14:21:27
0

【环球网科技综合报道】9月29日,据DeepSeek官方消息,DeepSeek-V3.2-Exp大语言模型正式发布并开源。该模型通过引入创新的稀疏Attention架构,在降低计算资源消耗的同时显著提升推理效率,为长序列文本处理提供了更优解决方案。

据官方介绍,DeepSeek-V3.2-Exp 模型是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。

具体来说,DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。据官方称,在新的价格政策下,开发者调用 DeepSeek API 的成本将降低 50% 以上。(青山)

相关内容

热门资讯

科技人才风采展丨攻坚克难铸匠心... 王兆波,1963年7月出生,先后入选济南市和山东省级人才工程,享受国务院特殊津贴专家,现任山东科华赛...
数字资源:中文在线丨2025年... 2025年,时值量子力学诞生一百周年,诺贝尔物理学奖被赋予了特殊的历史意义。奖项授予了约翰·克拉克、...
济宁高新区外贸企业新媒体与Ti... 齐鲁晚报·齐鲁壹点 孔茜 通讯员 康凯 日前,济宁高新区外贸企业新媒体与TikTok出海培训会召开。...
四维图新:PhiGo Max方... 证券之星消息,四维图新(002405)12月31日在投资者关系平台上答复投资者关心的问题。 投资者提...
“童心绘梦,翰墨飘香”饶阳县科... 在元旦佳节即将到来之际,饶阳县科协与饶阳县第二实验小学联合举办了“童心绘梦,翰墨飘香”主题迎元旦科幻...
浙江日报新年献词丨在逆风中韧性... 012025年世界动荡起伏,见证关税博弈、黄金暴涨与AI风潮,展现全球不确定性。 02中国首次入列全...
原创 欧... 欧洲为何开始幻想要在中国之前登月?为什么说欧洲登月面临的最大障碍其实来自美国?12月28日,欧洲新闻...
通讯|古埃及文物在人工智能应用... 新华社开罗12月31日电 通讯|古埃及文物在人工智能应用中“活”起来 新华社记者姚兵 董修竹 在埃及...
热爱正盛 长歌奋进——致全州生... 热爱正盛 长歌奋进 致全州生态环境系统干部职工的一封信 全州生态环境系统干部职工: 热爱滚烫,映照着...
随身WiFi vs 手机流量卡... 现在不管是出差办公、户外直播,还是宿舍共享上网,随身WiFi都成了不少人的刚需。但打开购物软件一搜,...