2026年伊始,全球AI算力战场烽烟再起。英伟达依托CUDA生态形成了近乎垄断的技术壁垒,“缺芯少魂”仍是中国AI产业发展的现实挑战。
在此背景下,深圳市大数据研究院持续深耕人工智能等前沿科技领域,并于2025年孵化智子芯元(深圳)科技有限公司,致力于“数学+AI”融合创新。成立仅5个月,该公司便凭借自主研发的KernelCAT工具,仅用38分钟完成DeepSeek-OCR-2模型在华为昇腾平台的自动化部署和推理验证,有力推动了我国算力底层的自主创新。
近日,深圳市大数据研究院研究科学家、智子芯元联合创始人丁添在接受记者采访时表示:“过去我们靠‘堆人’追赶,但AI发展太快,根本追不上。现在有了自动化工具,英伟达十几年的领先,原来要用人一步一步走,现在可以用‘AI+数学’自动走,几周的任务变成几十分钟,这是革命性的速度提升,能大幅缩短追赶时间。”
丁添认为,英伟达的护城河太厚了,十几年的算子库、完善的框架、几百万开发者。很多开发者第一天就用英伟达,不愿意学别的芯片。“这将是国产芯片弯道超车、换道超车唯一可能的途径”。
一
破壁之战,用AI Agent打通国产算力“任督二脉”
制约国产芯片发挥性能的真正痛点往往不在硬件本身,而在软件生态。国产芯片并不缺乏理论峰值性能,缺的是能让这些性能落地的“算子”。
算子(Kernel)是连接AI算法与计算芯片的“翻译官”:它将算法转化为硬件可执行的指令,决定了AI模型的推理速度、能耗与兼容性。
而长期以来,为了让一个模型在国产卡上顺利运行,顶尖工程师们不得不像“在深海中戴着手铐组装手表”一般,耗时数月手动编写底层代码,却依然难以触及性能极限。行业的共识是:突破这一瓶颈,不能依赖传统的“手工作坊”模式,而必须借助更强大的AI工具。
深圳市大数据研究院依托多年“数学+AI”的积累,实现了技术突破。丁添介绍,KarnelCAT工具相当于通过“AI+数学”自动生成算子,然后自动适配国产芯片,大幅提升了推理与训练效率。比如,它可以将英伟达训练好的模型直接“翻译”到华为昇腾平台。
更通俗的说法,就像“把Windows游戏安装到苹果电脑上”,传统方式需要工程师几周甚至几个月时间。但KarnelCAT全自动完成代码适配与性能优化,将时间压缩至几十分钟到几小时。
而这背后也涉及诸多的技术突破,AI负责代码生成与硬件分析、数学负责性能优化(运筹学)、硬件在环机制(强制在真实硬件上测试,克服大模型“幻觉”问题)等。
作为全球首个全自动AI模型迁移与优化工具,KernelCAT打破了英伟达的生态壁垒,打通了国产算力的“任督二脉”。
二
38分钟的奇迹,从“版本地狱”到“智能迁移”
把大象装进冰箱需要三步,但把顶级的 DeepSeek-OCR-2 模型“完美迁移”到国产华为昇腾(CANN)平台,曾被视为一场“噩梦”。
DeepSeek-OCR-2 是一款引入了“视觉因果流”设计的复杂多模态模型,对算子的要求极高。在过去,适配这类模型意味着要面对最令人头秃的“版本地狱”:vLLM、PyTorch 和 NPU 驱动之间错综复杂的版本互锁,牵一发而动全身。
但在 KernelCAT(智子芯元研发的 AI Agent)接手后,这场战役变成了一次丝滑的“自动驾驶”体验:
·智能排雷,秒解“三角债”启动任务的瞬间,KernelCAT迅速接管了战场。它没有盲目安装,而是通过对任务目标的深度理解,精准识别出各个依赖库之间的死锁矛盾。它像一位经验丰富的拆弹专家,自动补全缺失环境,硬生生在复杂的版本冲突中搭建起了一套稳定的生产环境。
·全程托管,无需人工38分钟。这是从下达指令到迁移完成的总耗时。在这38分钟里,开发者不需要反复试错,不需要通宵查日志。KernelCAT自动解析模型结构、自动生成迁移计划、自动处理报错。原本需要一支专家团队数周才能完成的工作,现在仅需一杯咖啡的时间。
昇腾平台(Ascend)是华为面向全场景AI打造的端边云协同全栈软硬件与生态体系,核心是“硬件开放、软件开源”,为AI训练或推理提供自主可控的国产算力底座。
据微信公众号“昇腾CANN”发布的消息,在前序模型DeepSeek-OCR部署任务中,KernelCAT给出的方案较原生Transformers方案的加速效果可达139倍。这一结果表明,在KernelCAT支持下,复杂OCR模型可以在国产算力平台上实现可用、稳定、可复现的工程落地。
三
深圳AI算力突围,填补国产算力生态薄弱环节
值得注意的是,KernelCAT的横空出世并非偶然,这背后是深圳市大数据研究院的长期深耕。2019年,该研究院就正式授牌成为深圳市基础研究机构之一,始终致力于解决“卡脖子”难题。
智子芯元团队则承袭了研究院“数学+AI”的发展路径。他们不走寻常路,将高深的运筹优化理论与最前沿的AI大模型技术结合,攻克了算法与算子这一“最后一公里”的难题。
从联合华为攻关昇腾生态关键技术,到获得顶尖资本战略投资,智子芯元正在用“深圳方案”填补国产算力生态中最薄弱的一环。
深圳市大数据研究院副院长张昕表示,研究院以数学为根,以国产算力为战场,用“AI+运筹优化”解决了AI Infra的“卡脖子”难题,正走出一条从基础研究到产业突破的深圳路径。“如果再找到类似的好发力点,我们可以如法炮制,大概率还能成功。”
“我们希望国产芯片上也能跑出世界一流的大模型。”丁添表示,未来希望KarnelCAT不只是迁移工具,更是计算加速开发的工具,能帮助国产芯片生态催生新模型。同时,他还强调,算力底座需要自主可控,军事、医学这些重要领域的模型,不应该跑在国外芯片上。“我们的工具可以帮助这些垂直领域,把AI用起来,并带来效率提升。”
在人工智能时代,像智子芯元这样聚焦芯片、大模型等关键赛道攻坚的企业不断涌现,贡献出越来越多的“深圳方案”。目前,深圳现有人工智能企业2600余家,产业链覆盖芯片、模型、硬件及应用等全环节,产业规模位居全国前列,连续两年实现两位数增长。
在这片沃土上,人工智能作为新质生产力,正在充分涌流。
采写:南都·湾财社记者 程洋