天数智芯选择的通用GPU道路,是既通过“凿井”深耕垂直场景实现商业闭环,又通过架构创新向“登月”高峰发起挑战。
文|王玉冰
ID | BMR2004
2026年1月8日,上海天数智芯半导体股份有限公司(以下简称“天数智芯”,09903.HK)正式在香港联合交易所主板挂牌上市。26日,天数智芯重磅发布了四代架构路线图,并提出预期于2027年超越英伟达Rubin架构,迈向更具创新的突破性架构设计。
天数智芯成立于2018年,是中国领先的通用GPU(GPGPU)芯片及AI算力解决方案提供商,致力于开发自主可控、国际领先的通用GPU产品。
基于天数智芯自主研发的通用GPU核心微架——天枢,公司衍化出面向不同场景的产品系列,包括云端训练芯片(天垓系列)、云端推理芯片(智铠系列)以及最新发布的边缘计算产品(彤央系列),旨在为AI模型训练、推理及边缘应用提供全栈式算力支撑。
当前,国际技术壁垒与“CUDA独裁”的严峻态势,使得算力成为全球核心战略资源,竞争焦点正从单一制程比拼转向系统级集群能力。在此背景下,天数智芯以其独特的自主知识产权(IP)体系,为国产算力突围困局提供了新的路径。
01
回归计算的本质
通用芯片的设计初衷,就是为了回归计算本质,支持所有种类的计算。它既能高效支持当前热点任务,也能从容支持那些我们还没想象到的全新算子和架构。
“当前,国内GPU企业分化出‘登月’与‘凿井’两条清晰的发展路径。”北京德和衡(上海)律师事务所资深知识产权法律专家黄政燏向《商学院》表示。
具体来看,“登月战略”追求算力峰值,对标国际旗舰,虽具国家级战略潜力,却深陷专利雷区与法律风险;而“凿井战略”则深耕垂直场景,通过“硬科技+软框架”构建差异化壁垒,快速实现商业闭环与现金流回正。天数智芯所选择的通用GPU道路,实质上是两者的有机结合:既通过“凿井”深耕垂直场景实现商业闭环,又通过架构创新向“登月”高峰发起挑战。
天数智芯AI与加速计算技术负责人单天逸提到,过去十年是算力野蛮增长的10年,规模的快速扩张确实带来了阶段性的产业繁荣。但繁荣背后,是难以忽视的效率困局。推理场景的平均利用率不足20%,训练场景的平均利用率也仅为在40%,“我们的理论算力一路飙升,可到了实际应用场景里,效率却大打折扣。”
“专用芯片诞生是为了加速特定算法、特定指令,比如矩阵乘法、Softmax这些主流任务,在限定的‘题库’里,它可以完成。但天数智芯所代表的通用芯片不一样。通用芯片的设计初衷,就是为了回归计算本质,支持所有种类的计算。它既能高效支持当前热点任务,也能从容支持那些我们还没想象到的全新算子和架构。”单天逸强调。
具体来看,通用芯片支持的不是某一类、某一种计算,而是几乎所有的数学运算图谱。从Scalar、Vector、Tensor到Cube,从FP64到FP4,从MMA 到DPX,不管是AI的Attention机制、前沿的科学计算,还是未来的量子计算相关模拟,都可以在通用芯片上稳定运行。
大任务、中任务、小任务,会被精准分配到不同的计算单元里。这就像一个规划科学的城市交通网,不会因为一辆重型卡车的通行,就堵死了所有的路。这种多核心架构,让天数智芯能实现更细粒度的任务拆解与分配,告别算力浪费,拉高计算效率。
伴随市场需求增长,天数智芯已经完成了四代产品迭代,截至2025年底,天数智芯的通用芯片已在互联网、大模型、金融、医疗、教育、交通等超过20个行业落地应用。
02
软硬件协同“作战”
AI竞争早已不是“单兵作战”,而是“集群作战”。谁掌握了“让1万颗芯片高效协同”的专利,谁就掌握了定价权。
单一芯片的性能领先是脆弱的,容易被后来者追赶或复制。黄政燏举了一个例子,若将GPU比作现代化兵工厂,其根基则在于指令集、基础IP与互联协议这三大底层系统,它们如同地基、核心模具与内部物流,共同构成技术自主的关键。
他认为,2026年,AI竞争早已不是“单兵作战”,而是“集群作战”。谁掌握了“让1万颗芯片高效协同”的专利,谁就掌握了定价权。
“因此,在构建专利护城河的战略选择上,应‘弃两头,守中间’,不过度追逐底层晶体管或善变的应用层,而应聚焦于系统级互联与软硬协同这一中间黄金地带,优先布局‘互联协议+智能编译器’的层级专利,形成如粘合剂般的集群效率优势。”黄政燏认为,这样即便单芯性能暂不领先,也可凭借更高协同性铁路网锁定用户生态。
而天数智芯选择的的核心策略正是将技术优势转化为一套受法律保护、系统性的知识产权体系。针对不同行业的独特需求,将这些技术积木搭建成难以绕行的完整解决方案,从而实现从性能领先到生态锁定的跨越。
单天逸表示,以天枢架构为例,它包含三项关键自研软硬件设计,共同瞄准了计算效率的根本瓶颈。
TPC BroadCast技术通过优化调度数据提升等效访存带宽;Instruction Co-Exec技术则着力实现不同指令的混合并行,以增强不同指令并行处理的能力;利用Dynamic Warp Scheduling技术调节数以千计的线程调度,以最大化地计算资源利用率。
在软件与系统层面,天数智芯开发了零意外、可预期的精准仿真系统。单天逸介绍道:“你只需要输入左上角的软件代码,系统会自动整合算力生产者(GPU)、CPU、网卡、PCIE等硬件组件,匹配网络拓扑,再结合软件策略、投机策略、Streaming LLM策略、前缀匹配等各类策略,最终精准输出。”
也就是说,客户只需要提交自己的AI模型软件代码,该系统便能自动模拟由天数智芯GPU、CPU、网卡等构成的真实硬件环境与网络连接,生成针对该模型的详细性能数据报告。这彻底改变了以往先投入巨额资金购买硬件、再测试性能的盲盒式部署模式,使客户能够基于确定、量化的性能预测做出投资决策,极大地降低了采购风险与项目不确定性。
03
重塑AI算力价值链
用最低的附加成本,以最快的速度,获得最强的业务竞争力。
在GPU产品的互联网应用端,天数智芯副总裁邹翾提到,AI应用已经普及,Chatbot、文生图这些工具大家每天都在用。“但行业真正的瓶颈只有一个:Token成本太高。成本并发压着体验和规模。这是所有互联网公司最真实、最核心的痛点。”
针对行业面临的能效比偏低、创造力不足、实际使用困难等问题,天数智芯提出了“高质量算力”的解决方案,将高质量算力定义为三大核心特质:高效率,通过优化设计为客户创造最优TCO(总体拥有成本),从容应对复杂应用场景;可预期,借助精准仿真模拟,让客户在部署前即可预判性能表现,实现“所见即所得”;可持续,无缝适配从传统算法到未来未知算法的演进,确保长期使用价值。
以天垓系列为例,这款产品可以为人工智能、高性能计算等负载提供强大的并行计算能力,通过软硬件深度协同优化,显著提升大模型训练、科学计算等任务的效率。天垓可以在降低单位算力成本(如Token成本)的同时,支持千亿参数模型的敏捷开发与部署,帮助客户在云端构建可靠、高性能且自主可控的算力基础设施。
邹翾提到,天垓150凭借先进的多任务并行处理系统和高度兼容的软件栈,能够自动拆解、调度复杂计算任务,实现新模型的开箱即用。“凭借这种低开发成本、高性能开箱即用的优势,天垓150在发布当天即支持国内15种以上的新模型。目前,在实际集群中已稳定运行超过150种模型及变种,以及100余种定制算子,成为用户快速开发、敏捷部署的国产首选平台。”
在硬件攻坚方面,邹翾谈到,天垓150的策略很明确:把长序列首字吞吐和延迟做到极致。天数智芯独立研发的ix-Attention架构,目标是在同等算力下实现更低的延迟和更高的吞吐量,使得客户等待信息处理的时间大大缩短。由于天垓150的服务器处理每个长请求的速度更快、更高效,同样的集群规模可以同时流畅服务300个用户,而且还能保持相同的响应速度。
“在软件层面,我们完全按互联网客户的需求来做。通过Prefill / Decode分离,提供与用户框架(比如xllm)兼容的接口,以及底层编程模型,客户只需其他产品1/3的精力就可以完成开发调优。同时,我们和系统伙伴将计算、互联、存储、机架部署全部打通,直接给客户提供一个能直接上线的完整方案。”邹翾表示。也就是说,天数智芯的软件服务不只是卖给客户更好的芯片,还能为客户量身调试好软件接口,这就解决了互联网公司最根本的诉求:用最低的附加成本,以最快的速度,获得最强的业务竞争力。
关于软件生态的构建,国产GPU企业正面临“兼容现有”与“构建自主”的矛盾。黄政燏提醒道,在GPU领域,硬件决定你会不会“猝死”,但软件决定你能“活”多久。
黄政燏认为,兼容路径虽能借道超车、快速切入市场,却容易深陷法律雷区,从而受制于技术巨头的授权政策与底层专利围剿;而构建自主生态虽初期艰难,却能在垂直领域开宗立派,通过标准必要专利(SEP)形成壁垒,法律风险相对可控。
因此,在2026年,黄政燏认为,国产GPU企业软件生态的破局之道在于走“表层兼容、底层换芯、垂直自立”的平衡路线。以源代码级兼容作为市场入场券,以编译器层为核心投入,构建自主软件框架,并在政务、大模型等特定场景中逐步建立生态话语权。“国产GPU企业不应试图推翻CUDA,而应试图让CUDA无关紧要。当我们在特定垂直场景下,利用自主协议实现了比CUDA更好的算力产出比(Performance per Token),那堵围墙自然就不攻自破了。”
此外,为了将天数智芯的云端能力下沉至具体的物理场景,2026年1月26日,天数智芯还正式发布了彤央系列产品,完成了“云+边+端”的全场景算力布局。
在具身智能领域,彤央系列与格蓝若机器人的合作中,彤央TY1100算力模组作为机器人的“大脑”,其高算力、低延迟、灵活拓展的能力正好适合物理AI在机器人方面的应用;在工业领域,比依电器将彤央TY1100_NX算力终端部署于园区与产线。通过运行先进的机器视觉算法进行质量检测、行为分析,或通过时序模型预测设备故障;在商业领域,瑞幸咖啡全国数千家门店已经部署了彤央方案,能够帮助商家实现精细化运营;在交通智能领域,在全国“车路云一体化”的20大应用试点城市名单中,天数智芯已经率先与头部试点城市展开合作。
单天逸提到,进入2026年,天数智芯将密集推出两代产品:首先是 “天璇”架构,它将部分对标英伟达更先进的 Blackwell架构,并引入新的低精度计算格式以提升效率;紧随其后的“天玑”架构,则旨在实现对Blackwell架构的全面超越,能够完整覆盖从AI训练推理到科学计算等所有加速计算场景。
04
以专利布局避开出海雷区
知识产权的国际布局与风险规避,成为其能否在全球市场站稳脚跟的关键。
随着中国AI产业的全球化进程加速,知识产权的国际布局与风险规避,成为其能否在全球市场站稳脚跟的关键。
黄政燏提到,在2026年,许多国产GPU企业试图扬帆出海,这不仅是产品的输出,更是一场法律与规则的较量。“当我们离开本土的保护伞,面对的是深耕数十年的国际巨头(如英伟达、AMD)布下的专利雷区。”
黄政燏谈到,目前我国出海企业首当面临三大致命暗礁:一是美国“337调查”的长臂管辖,其迅疾的“普遍排除令”可连坐下游产品,实现市场封杀;二是专利流氓(NPE)的投机围猎,他们会专挑企业关键节点发起诉讼以勒索高额和解金;三是标准必要专利(SEP)的刚性过路费,HBM、视频解码等通用技术专利池将直接侵蚀企业的利润。
为此,黄政燏认为国产GPU企业应将东南亚、中东、南美等“一带一路”及新兴制造中心作为第一梯队,抢占市场与供应链源头;将德国、法国等欧洲诉讼高地作为第二梯队,布局车规级芯片专利以防守高端市场准入;即便难以进入美国市场,也应在第三梯队申请少量毒丸专利,以备反诉谈判之需。
在国家层面,黄政燏提出必须构建超越资金支持的护航体系,组建国家主导的防御性专利池,建立全球专利风险预警机制,并全力推动国产互联协议等中国标准国际化,使我们的专利成为他人不得不遵守的路条。
在未来,天数智芯应继续以高质量算力为核心,坚守自主创新之路,与产业链上下游合作伙伴携手同行,为中国数字经济高质量发展注入强劲“芯”动力。
来源 | 《商学院》杂志2&3月合刊