当地时间6月24日,OpenAI联合博通(Broadcom)正式发布了其首款自研的人工智能(AI)芯片——Jalapeño,标志着OpenAI完成了构建其软硬件全栈自研战略的重要一步。
△OpenAI CEO萨姆·奥尔特曼与博通总裁兼首席执行官陈福阳共同手持晶圆的照片
专为LLM推理而生,成本降低50%
Jalapeño并非通用AI加速器或者是面向训练的AI加速器,而是一款专为当前及未来大语言模型(LLM)推理任务而从零开始设计的专用集成电路(ASIC)。主要涵盖ChatGPT、Codex和OpenAI的API应用。
据介绍,从项目启动到制造流片(Tape-out),Jalapeño仅用时9个月,号称是高性能ASIC领域最快的开发周期之一。这一速度得益于OpenAI工程团队与博通的深度软硬件协同,以及利用OpenAI自研的AI模型加速了部分设计与优化工作。
OpenAI硬件项目负责人Richard Ho表示:“Jalapeño是从零开始为LLM推理设计的,基于我们与OpenAI研究人员密切合作的详细洞察。”“我们围绕内核、内存移动、网络和服务模式优化了架构,这些对前沿AI模型来说至关重要。基于早期测试,Jalapeño将高效地在硬件理论极限范围内执行我们最重要的工作负载。”
目前,Jalapeño的工程样品已在实验室以生产目标频率和功率运行机器学习工作负载,包括GPT-5.3-Codex-Spark。尽管Jalapeño最终性能数据尚在测量中,但早期测试显示其每瓦性能将“明显优于当前最先进水平”。
博通CEO陈福阳向媒体透露,Jalapeño相比典型AI GPU展现出约50%的成本降低。
如果Jalapeño的能效与成本优势若在后续商用中得到验证,将有望缓解OpenAI巨大的算力支出压力。2025年OpenAI运营亏损高达209亿美元,其中研发与包括AI芯片在内的AI基础设施是最主要的支出。如果自研芯片能够获得成功,将有望大幅降低其AI基础设施的成本,这也被视为其通向盈利的关键路径之一。
2026年底落地,剑指吉瓦级算力
Jalapeño是OpenAI多代AI计算平台的首款产品。根据计划,Jalapeño将于2026年底完成首批部署,并在未来数年持续扩容。
Jalapeño是由博通负责为OpenAI进行定制开发,博通贡献了硅芯片实现、网络和连接技术。另一家公司Celestica则提供板卡、机架和系统集成。
OpenAI总裁兼联合创始人Greg Brockman表示:“世界正在向计算机驱动的经济转型。”“Jalapeño是我们长期全栈基础设施战略的一部分,旨在让计算更加丰富,从而创造出更快、更可靠、更实惠、对个人和企业更有利的人工智能,并能用来解决更重要的问题。通过自行设计更多技术栈,我们可以以更高效率提供更多智能,并推动先进人工智能向更广泛的访问方向发展。”
博通总裁兼首席执行官陈福阳说:“我们与OpenAI的合作代表了对未来十年人工智能物理基础设施扩展的根本承诺。”“这只是多代人路线图的开始。通过与OpenAI直接共同开发行业领先的硅片,我们将与微软及其他合作伙伴共同部署吉瓦级数据中心,计划从2026年开始。”
编辑:芯智讯-浪客剑