“龙虾”挥钳,算力吃紧
创始人
2026-04-02 19:09:01
0

来源:科技日报

“龙虾”挥舞的双钳下,是一个深不见底的算力黑洞。

有机构算了一笔账:相比传统聊天机器人,智能体的Token(词元)消耗动辄放大数十倍,一个稍微复杂一点的任务,背后吃掉的算力,甚至可能是普通对话的百倍、千倍。有科技博主实测,如果真把“龙虾”当成生产工具放开用,一周下来,费用接近万元。

数据是最直观的注脚。“养虾”火起来之后,模型调用量极速攀升。全球API聚合平台OpenRouter的数据显示:3月16日至22日,全球大模型调用量已经达到20.4万亿Token,一周涨了两成多。其中,中国大模型的周调用量涨幅更是超过五成,并且已经连续第三周超过美国。当周全球调用量排名前四的模型,也全部是“中国造”。

国家数据局公布的数据显示,今年3月,中国日均Token调用量已突破140万亿,两年增长了上千倍。

在不少业内人士看来,这样的增长既令人兴奋,也暗含隐忧。

3月27日中关村论坛年会的一场AI主题论坛上,算力缺口几乎成了绕不开的话题。“OpenClaw带来算力需求的暴增。”无问芯穹CEO夏立雪观察到,“上次见到这样的增速,还是当年3G手机刚普及,手机流量不够用的时候。以后我们的手机里可能会有两张卡,一张是SIM卡,一张就是‘Token卡’。”

问题在于,需求的曲线已经陡峭起来,供给却还没完全跟上。“让更聪明的模型执行更复杂的任务,资源消耗极大。如果算力不够,一个问题丢进去半天没有响应,一切体验都是空谈。”智谱华章CEO张鹏说得直白。在他看来,推理需求正以百倍级别爆发,算力很可能成为制约行业发展的核心瓶颈。

夏立雪认为,当前阶段,与其单纯扩张算力规模,不如把已有资源用到极致。围绕这个目标,他提出,应加快构建更高效、标准化的“Token工厂”,提供持续稳定、规模化的Token服务,使顶尖模型能力高效赋能海量下游场景,尽可能提升每一个Token的转化效率,让算力“花得值”。

再往远一点看,未来的基础设施本身也会走向智能化,可以自我调度、自主优化,甚至内置Agent来充当“管理者”,让算法与算力系统形成更紧密的深度协同。

面对“算力焦虑”,也有人重申架构创新的价值。

小米MiMo大模型负责人罗福莉回忆,两年前,在算力受限的情况下,中国团队依然通过模型架构创新,“逼出”更高效率,比如DeepSeek的探索,“这给了我们勇气和信心”。

如今,虽然硬件条件已经改善,国产芯片不再受限,但这种对更低推理成本、更高算力效率的探索,依然会在智能体时代成为未来竞争的关键。

相关内容

热门资讯

科创001 | “算力上天”赛... 深圳商报·读创客户端首席记者 王海荣 6月29日,持续两天的2026全球数字经济大会首届全球太空算力...
分拆可灵再造一个新快手?程一笑... 可灵的表现,将是衡量程一笑时代快手的重要指标。 2026年智谱暴涨的市值,让很多互联网巨头陷入了尴尬...
华为Mate 40 Pro早期... IT之家 6 月 29 日消息,B站 UP 主 @才羽モモイMomoi 昨晚(6 月 28 日)发布...
甘肃工程咨询集团科学技术协会成... 新甘肃客户端讯(新甘肃客户端记者 李杨 万及敏)6月26日,甘肃工程咨询集团股份有限公司科学技术协会...
市政协召开“聚焦智慧场景应用 ... 6月29日,市政协召开“聚焦智慧场景应用 推进数字营口建设”专题协商会。市政协主席李红莉参加会议并讲...
大数据与AI如何真正进入医疗现... “在这里,医疗AI已不是概念,我看见AI进入真实诊疗流程。”6月29日,在复旦大学附属中山医院举行的...
AI算力建设提速拉动上游需求,... 来源:界面新闻 近日,香港科技园公司与商汤科技签署合作备忘录,围绕AI算力基础设施搭建、AI产业生态...
杨燕青:AI正在改写经济学底层... 来源:第一财经 经济学界必须重新评估传统的内生增长模型、劳动力市场出清机制以及现有的社会财富契约。 ...
原创 众... 众泰汽车,又有了新动静。 近日,印尼BPKN主席穆罕默德·穆夫提·穆巴拉克博士带队商务考察团,专程到...
存储三巨头合谋制造“内存末日”... 6月29日消息,据报道,三星、SK海力士和美光6月25日在美国加利福尼亚联邦法院被提起集体诉讼,被控...