在2026年世界电信和信息社会日大会的技术研讨会上,中国联通研究院副院长、首席科学家唐雄燕发表了题为《面向Token运营的互联网基础设施演进》的主题演讲,首次提出“Token Net”技术理念,推动算力智联网AINet向面向Token运营的智能互联网基础设施全面升级。Token Net以低成本、高安全、高质量、生态化的Token运营为目标,通过算网资源层、大模型服务层、智能服务层、Token运营层四层架构协同,打通算网资源、AI大模型、智能体服务与用户应用之间的价值闭环,助力中国联通实现从“流量运营”到“Token运营”的战略转型。
01
从AINet到Token Net:互联网基础设施的演进跃迁
唐雄燕在演讲中指出,中国联通的网络架构经历了宽带联网(CUBE-Net 1.0)、弹性云网(CUBE-Net 2.0)、智能算网(CUBE-Net 3.0)的演进历程,当前正加速迈向AI原生智网的新阶段。在这一进程中,中国联通于2024年发布算力智联网AINet,以“高通量、高性能、高智能”为核心能力,构建了覆盖全国“东数西算”八大枢纽和上百个重要节点的智能算力网络底座。随着AI大模型商业化浪潮席卷全球,Token作为AI能力和服务的核心载体,正从技术术语走向商业赛道。日均百亿级甚至万亿级的Token高并发调用,对互联网基础设施提出了全新挑战。在此背景下,中国联通锚定连接、算力、服务和安全四大核心赛道,在AINet基础上进一步提出Token Net技术概念和架构体系,将Token运营作为基础设施演进的核心驱动力,推动互联网从“连接信息”向“连接智能”的范式跃迁。Token Net不仅是AINet的能力延伸,更是面向AI产业价值链的一次系统性架构升级。
02
Token Net四层架构:多层协同的基础设施体系
唐雄燕详细阐述了Token Net的四层架构体系。该架构以Token运营为目标牵引,自下而上分为算网资源层、大模型服务层、智能服务层和Token运营层,各层之间逐层赋能、协同运作,共同构成面向Token运营的端到端基础设施能力。
算网资源层:夯实算网底座
算网资源层是Token Net的基础底座,以中国联通算力智联网AINet为核心,构建从用户侧到AI算力侧的全链路算网资源通道,打造DCA、DCI、DCN一体贯通的智算网络架构,结合智算网关实现广域无损传输与确定性保障,通过以联通“星罗”为代表的算网大脑实现算网统一编排,为上层服务提供高效安全的算力供给。
大模型服务层:面向Token运营的推理优化
大模型服务层聚焦于面向Token运营的推理服务优化,围绕Token低成本、高质量的运营目标,基于PD分离推理架构实现高吞吐、低成本、弹性可控的新一代推理服务能力。在广域层面,面对低时延、低成本、高并发、高安全的极致要求,发挥运营商在广域网络和边缘算力资源方面的优势,打造云边端协同的分布式推理能力,全面实现推理服务的提质增效。
智能服务层:构建智能体互联网
以智能体为主体的智能服务层是Token Net中连接AI能力与产业应用的关键桥梁,通过将大模型作为“大脑”并与工具、环境深度结合,推动人工智能从认知层迈向行动层。智能体是Token的主要生产者和消费者,智能体应用和人机协同是Token赋能生产的落地形式。中国联通于2025年8月在业内率先发布《智能体互联网白皮书》,2026年3月发布联通智能体平台UniClaw,并于2026年4月发布CubeMAP智能体互联网平台及协议框架,推动互联网从“连接信息”向“连接智能”升级。
Token运营层:可运营的Token分发网络(TDN)
Token运营层是Token Net面向用户运营服务的关键。唐雄燕重点阐述了TDN(Token Delivery Network,Token分发网络)的定义与内涵。TDN依托运营商算网一体化资源优势,以Token感知路由和智能分发为核心,实现Token分发、KVCache缓存与算网资源的协同调度,从而降低Token成本、提升服务质量,构建网络化和服务化的Token运营体系。TDN的提出,源于两大核心驱动力:一是需求驱动,用户对Token服务的差异化SLO要求日益增长,而资源分散、重复计算导致的资源利用率低、服务质量难以保障等问题亟待解决;二是技术驱动,PD分离架构与混合注意力机制等技术为AI分布式推理和Token精细化运营提供了技术基础。
唐雄燕指出,TDN将围绕四项关键技术构建核心能力体系:
服务调度:以广域覆盖、低时延、高可靠的网络能力为底座,构建运营商级Token路由与调度方案,通过差异化网络能力赋能Token服务,实现算、网、模一体化协同,为用户提供最佳Token接入体验。TDN支持基于多要素的Token路由,综合考虑用户请求特征、网络状态、算力状态等多维度因素,实现精准调度。Token Hub作为核心枢纽,可以汇聚多家供应商的Token资源,实现算力与模型的多样化供给,支撑多场景接入需求。
缓存分发:从现阶段智算中心内的KV Cache动态管理和高效复用,走向跨智算中心的全局调度,构建KV Cache广域级分发调度能力,实现“网存换算”、资源协同提效,破解大模型推理性能与成本矛盾。KV Cache是大模型推理过程中的关键中间产物,通过前缀匹配技术实现缓存复用。当用户请求与历史上下文存在匹配时,可直接命中KV Cache并跳过Prefill阶段,从而大幅降低计算量,显著降低TTFT(首Token响应时间)。TDN通过广域网动态路由调度、算力与本地缓存协同,实现网络、计算、存储资源的有效置换和最佳匹配。
度量计费:建立统一的Token度量与计费机制,为Token的生产、调度和流通奠定基础,实现Token运营的可量化、可比对、可结算。TDN支持精确区分Token不同类型,为差异化计费提供依据。通过智能计费引擎,实现Token流转的精细化管理,支持按量计费、按质计费等多种模式,满足不同业务场景的计费需求。
安全保障:构建智能监控体系,实现Token运营全链路的可视化、可追溯、可优化,覆盖Token生成、传输、分发、计费、运维全生命周期安全防护。TDN以“安全可信、精细管理”为原则,支持Token流转的全链路追踪,确保Token生产、分配、消费各环节安全合规,保障模型安全、数据安全、网络安全。
03
展望:构建面向Token运营的智能互联网基础设施
唐雄燕表示,Token Net的提出是中国联通顺应AI时代技术趋势,对数字信息基础设施演进的创新探索。从AINet到Token Net,不仅是网络技术架构的升级,也是运营商从“流量运营”向“Token运营”战略转型的体系重构。面向未来,中国联通希望携手产学研生态伙伴,共同推动Token Net的技术创新、标准制定与场景应用,坚持守正创新,积极构建面向“低成本、高质量、高安全、生态化”Token运营的智能互联网基础设施,为智能经济高质量发展注入新动能。