大模型,套上算力“紧箍咒”
创始人
2026-04-13 18:18:56
0

智东西

编译 | 佳扬

编辑 | 云鹏

智东西4月13日消息,据华尔街日报报道,随着全球AI热潮持续升温,算力供给正日益趋紧。

行业头部的Anthropic,不仅陷入系统频繁宕机、服务稳定性大幅下滑的困境,还出现用户投诉、部分企业客户流失的问题。截至4月8日,Anthropic公司的Claude API在过去90天内的正常运行时间为98.95%低于软件公司通常向客户承诺的99.99%

▲Claude API服务中断时间(来源:华尔街日报)

华尔街日报3月29日的报道曾指出,OpenAI因算力紧张被迫收缩业务战线,放弃此前备受市场关注的Sora视频生成应用,将有限算力集中投入至代号“Spud”的新AI模型研发中,优先保障核心业务的稳步推进。

与此同时,高端GPU租赁价格迎来惊人涨幅,租用英伟达最先进的Blackwell系列芯片,每小时费用已达4.08美元,较两个月前的2.75美元上涨48%,短短两个月内涨幅接近五成

一、AI巨头纷纷约束算力

算力短缺已成为头部AI企业发展的核心阻碍,多家巨头不得不通过收缩业务、限制用户资源等方式应对危机。Anthropic首席财务官莎拉·弗莱尔在近期投资者访谈中直言,“我确实花了很多时间寻找任何可用的临时计算资源。目前,由于计算资源不足,我们不得不做出一些非常艰难的取舍,放弃一些我们正在推进的项目。”

算力需求的爆发式增长是这场危机的直接推手。数据显示,OpenAI API的token使用量从去年10月的每分钟60亿次,飙升至今年3月下旬的150亿次,短短五个月内增幅达150%。为应对算力缺口,OpenAI已放弃此前备受市场关注的Sora视频生成应用,将有限的算力集中投入到代号为“Spud”的新AI模型及企业级产品开发中,优先保障核心业务推进。

作为OpenAI的主要竞争对手,Anthropic也面临着相似问题。Anthropic的营收预期一路飙升,从最初预计2025年底实现90亿美元年化收入,到今年2月攀升至140亿美元,两个月后更是翻倍至300亿美元。

但3月下旬,Anthropic被迫出台限制措施,宣布在太平洋时间工作日早5点至11点的高峰时段,限制用户可使用的token数量。这一举措引发用户广泛不满,多位用户在X论坛上抱怨资源消耗过快,有用户表示,此前数周都未用完的token上限,如今仅45分钟就已耗尽。对此,Claude Code创始人兼负责人Boris Cherny在X上回应称,公司正全力应对Claude持续增长的需求,产能作为核心资源需谨慎管理,未来将优先保障核心用户与API使用者的体验。

二、越来越贵的算力

纽约数据提供商Ornn的数据显示,近几个月来,英伟达全系列GPU产品的现货市场价格大幅上涨,尤其是数据中心云端访问的GPU价格,涨幅尤为明显。

算力需求的激增,直接推动行业定价机制调整与长期合同绑定。去年年底,全球最大上市AI云公司之一的CoreWeave将GPU租赁价格上调20%以上,同时将小型客户的服务合同期限从1年延长至至少3年。上月底,美国银行分析师恢复对CoreWeave的“买入”评级,并预测至少到2029年,该公司的算力服务需求仍将持续超过供给,算力紧张局面难以缓解。

具体来看,高端GPU的租赁价格涨幅惊人。根据Ornn计算的价格指数,租用英伟达最先进的Blackwell系列芯片一小时的费用已达4.08美元,较两个月前的2.75美元上涨48%,短短两个月内接近2倍涨幅,凸显算力资源的稀缺性。

“我经营这家公司五年多来,从未见过如此严重的容量短缺。”云基础设施公司Vultr首席执行官JJ Kardwell直言,算力短缺的核心症结并非企业不愿部署更多设备,而是交付周期过长。数据中心建设耗时久,且截至2026年的可用电力已被全部预订一空,短期内无法通过新增设备缓解缺口。

三、算力短缺导致AI服务质量低,客户流失

算力短缺不仅推高成本,更直接影响AI服务的稳定性,甚至导致企业客户流失。自2月中旬以来,Anthropic的系统故障愈发频繁,部分企业客户已开始转向其他AI模型提供商。软件开发平台Retool创始人兼首席执行官David Hsu表示,他此前一直倾向于使用Anthropic的Opus 4.6模型驱动公司AI代理工具,认为其最适配企业级应用,但近期因Anthropic服务器频繁不稳定,已转而采用OpenAI的模型

互联网核心服务的可靠性通常以“9”为衡量标准,四个“9”(99.99%的正常运行时间)是软件公司向客户承诺的常规标准,但截至4月8日,Anthropic的Claude API在过去90天内的正常运行时间仅为98.95%。

“这不正常。”人工智能推理初创公司Baseten联合创始人兼首席技术官Amir Haghighat评价道,AWS、数据库、RDS或Stripe等核心服务,均需保障极高的弹性和正常运行时间,而当前AI行业的服务质量与之相差甚远,“没有企业愿意为应用程序的智能服务,选择稳定性如此之差的提供商”。

结语:AI的算力竞争

当技术突破的速度超越基础设施建设的步伐,最终考验的不仅是企业的技术实力,更是整个产业链在算力供需失衡下的应变能力。

对于押注AI的科技巨头而言,如何在项目取舍、成本控制与服务质量之间找到平衡,是下一步的关键问题。

来源:华尔街日报

相关内容

热门资讯

AI工具的普及是提升还是抑制了... AI工具的普及,表面上提升了信息处理效率,实则正在系统性抑制人类思维能力。其核心逻辑在于AI通过“认...
智元开卷具身智能Agent,「... 人工智能领域的Agent热,毫无悬念地烧到了具身智能领域。 4月13日,智元(AGIBOT)推出面向...
67名选手同台竞技!重庆北碚这... 4月11日,第十三届重庆科普讲解大赛北碚赛区预选赛暨2026年碚绵广科普讲解大赛在重庆北碚图书馆梧桐...
元戎启行CEO周光:L3很可能... 每经记者|刘曦 每经编辑|裴健如 “随着大模型、端到端、多模态的快速发展,我认为L3很可能会被跳过...
安徽“双创汇”走进铜陵 科创赋... 会议现场(央广网发 铜陵市委宣传部供图) 4月13日,安徽“双创汇”走进铜陵暨“智造铜都科创未来”路...
医疗服务提升年|赋能智慧医疗,... 今日永州讯(通讯员 陈芳)为深入推进互联网+医疗健康便民服务,打通妇幼健康服务“最后一公里”,永州市...
聚焦数智能力,伊春干部集体“充... □本报记者 刘晓云 懂“未来”,才能创未来。聚焦干部能力建设,林都伊春又出“智”招。 近日,“林都讲...
全国最大功率纯电动机车投入运行 来源:科技日报 记者4月10日从连云港港口控股集团有限公司获悉,全国首台3000千瓦充换电一体纯电动...
贵州移动:AI机器狗巡山识嫩芽... 4月的黔贵大地,茶山染绿,新芽满枝。在中国移动贵州公司直播间里,主播带网友云游茶区,并直观展示5G智...
从“设备替代”到“模式定义”:... 如果说过去二十年中国重症监护室里的“救命机器”几乎全是进口品牌的标签,那么在第93届中国国际医疗器械...