OpenAI绕过英伟达,发布超高速AI编程模型
创始人
2026-02-14 11:40:40
0

周四,OpenAI发布了首个在非英伟达硬件上运行的生产级AI模型,在Cerebras芯片上部署了全新的GPT-5.3-Codex-Spark编程模型。该模型以每秒超过1000个Token的速度生成代码,据报告比其前代产品快约15倍。作为对比,Anthropic的Claude Opus 4.6在新的高价快速模式下,速度约为标准模式68.2 Token/秒的2.5倍,尽管它是比Spark更大更强的模型。

"Cerebras一直是我们出色的工程合作伙伴,我们很高兴能将快速推理添加为新的平台能力,"OpenAI计算部门负责人Sachin Katti在声明中表示。

Codex-Spark是一个研究预览版,面向ChatGPT Pro订阅用户(每月200美元)通过Codex应用、命令行界面和VS Code扩展提供。OpenAI正在向精选设计合作伙伴推出API访问。该模型配备128,000个Token的上下文窗口,发布时仅处理文本。

此次发布基于OpenAI本月早些时候推出的完整GPT-5.3-Codex模型。完整模型处理重量级智能体编程任务,而OpenAI将Spark调整为速度优先而非知识深度。OpenAI将其构建为纯文本模型,专门针对编程进行调优,而不是处理更大版本GPT-5.3所承担的通用任务。

在评估软件工程能力的两个基准SWE-Bench Pro和Terminal-Bench 2.0上,据OpenAI称,Spark的表现优于较老的GPT-5.1-Codex-mini,同时以更短时间完成任务。该公司未分享这些数据的独立验证。

据传闻,Codex的速度一直是痛点;当Ars在12月测试四个AI编程智能体构建扫雷游戏克隆时,Codex耗时约为Anthropic Claude Code的两倍才产生可用游戏。

编程智能体军备竞赛

从背景来看,GPT-5.3-Codex-Spark每秒1000个Token代表着比OpenAI通过自有基础设施提供的任何产品都有相当大的飞跃。根据Artificial Analysis的独立基准测试,OpenAI在英伟达硬件上最快的模型远低于这个标准:GPT-4o约为每秒147个Token,o3-mini约为167个,GPT-4o mini约为52个。

但按Cerebras标准,每秒1000个Token实际上是适中的。该公司在Llama 3.1 70B上测得每秒2100个Token,在OpenAI自己的开放权重gpt-oss-120B模型上报告每秒3000个Token,这表明Codex-Spark相对较低的速度反映了更大或更复杂模型的开销。

AI编程智能体度过了突破性的一年,OpenAI的Codex和Anthropic的Claude Code等工具在快速构建原型、界面和样板代码方面达到了新的实用水平。OpenAI、谷歌和Anthropic都在竞相推出更强大的编程智能体,延迟已成为决定胜负的关键;编程速度更快的模型让开发者迭代更快。

面对Anthropic的激烈竞争,OpenAI一直在快速迭代其Codex产品线,在CEO萨姆·阿尔特曼因谷歌的竞争压力发出内部"红色警报"备忘录后,于12月发布了GPT-5.2,然后在几天前推出了GPT-5.3-Codex。

摆脱英伟达依赖

Spark更深层的硬件故事可能比其基准分数更重要。该模型运行在Cerebras的Wafer Scale Engine 3上,这是一个餐盘大小的芯片,Cerebras至少从2022年起就围绕它建立业务。OpenAI和Cerebras在1月宣布合作伙伴关系,Codex-Spark是其首个产品成果。

过去一年,OpenAI一直在系统性地减少对英伟达的依赖。该公司在2025年10月与AMD签署了大规模多年协议,11月与亚马逊达成380亿美元云计算协议,并一直在设计最终由台积电制造的自定义AI芯片。

与此同时,与英伟达计划中的1000亿美元基础设施协议至今未果,尽管英伟达随后承诺200亿美元投资。路透社报告称,OpenAI对某些英伟达芯片在推理任务上的速度不满,而这正是OpenAI设计Codex-Spark要处理的工作负载类型。

无论底层使用哪种芯片,速度都很重要,尽管可能以准确性为代价。对于整天在代码编辑器中等待AI建议的开发者来说,每秒1000个Token可能不再像精心驾驶拼图锯,而更像运行开料锯。只是要小心你在切什么。

Q&A

Q1:GPT-5.3-Codex-Spark是什么?有什么特点?

A:GPT-5.3-Codex-Spark是OpenAI发布的专门用于编程的AI模型,运行在Cerebras芯片上。它最大的特点是生成代码速度极快,每秒超过1000个Token,比前代产品快约15倍。该模型专门针对编程任务调优,优先考虑速度而非知识深度。

Q2:Codex-Spark的速度相比其他AI编程工具如何?

A:Codex-Spark每秒1000个Token的速度远超OpenAI之前的模型,比如GPT-4o约为每秒147个Token。相比Anthropic的Claude Opus 4.6快速模式也有明显优势。不过按Cerebras芯片的标准这个速度还算适中,该公司在其他模型上曾测得更高速度。

Q3:为什么OpenAI要使用Cerebras芯片而不是英伟达?

A:OpenAI正在系统性地减少对英伟达的依赖。据报告,OpenAI对某些英伟达芯片在推理任务上的速度不满意。Cerebras的Wafer Scale Engine 3芯片在推理速度上表现更好,正好满足快速编程任务的需求,这也是OpenAI与Cerebras合作的重要原因。

相关内容

热门资讯

脚本专业!wpk俱乐部有没有辅... 脚本专业!wpk俱乐部有没有辅助,wpk是真的还是假的(透视)本来存在有器(哔哩哔哩)1、这是跨平台...
值得注意的是!we-poker... 值得注意的是!we-poker是什么软件,微乐辅助靠谱麻,有挂脚本(有挂实锤)-哔哩哔哩1、下载好w...
有消息称!德普之星怎么设置埋牌... 有消息称!德普之星怎么设置埋牌,微乐福建辅助器,揭幕透视(有挂透视)-哔哩哔哩1、德普之星怎么设置埋...
透视积累!hhpoker到底可... 透视积累!hhpoker到底可以作必弊吗,HHpoker脚本都是真的有工具,第二分钟教程(竟然有挂)...
脚本辅助!德普之星怎么设置埋牌... 脚本辅助!德普之星怎么设置埋牌,如何下载德普之星辅助软件(透视)真是是有攻略(哔哩哔哩)1、该软件可...
透视攻略!aapoker破解侠... 透视攻略!aapoker破解侠是真的吗,AApoker方法确实有辅助,三分钟教程(有挂辅助)1、每一...
透视透视!hhpoker透视脚... 透视透视!hhpoker透视脚本视频,微乐小程序辅助开发透视,详细脚本(有挂头条)-哔哩哔哩1、进入...
脚本必备!aapoker能控制... 脚本必备!aapoker能控制牌吗,aapoker怎么选牌(透视)果然是有攻略(哔哩哔哩)1、很好的...
透视好友房!菠萝辅助器免费版的... 透视好友房!菠萝辅助器免费版的功能介绍,微乐自建房怎么提高胜率,开挂脚本(有挂方法)-哔哩哔哩1)菠...
透视方针!wpk俱乐部辅助器,... 透视方针!wpk俱乐部辅助器,WPK四人原来是真的有透视,第四分钟教程(有挂解密)该软件可以轻松地帮...