手术视频大模型“术影”开源发布,助力术者从看画面到懂操作
创始人
2026-03-25 17:40:39
0

3月24日,中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)在香港科学园深圳分园发布“术影”SurgMotion手术视频大模型。该模型基于涵盖约1500万帧、超3658小时真实手术视频的SurgMotion-15M数据集进行训练,在17个国际权威手术AI基准上全面刷新最优纪录,标志着手术AI从“碎片化识别”向“通用化理解”的跨越式进化,为临床治疗、手术操作、医学教学及术后复盘提供有力支撑。

从“看画面”到“看懂操作”:视频原生架构的范式革命

“术影”手术视频大模型突破传统像素重建的局限,引入运动引导的隐空间预测机制,显著提升了模型对手术器械、解剖结构、交互动作等关键语义结构的理解能力。据CAIR研究员易东介绍,研究团队在V-JEPA架构基础上引入运动引导的隐空间预测、特征多样性保持和模型稳定性保持三项技术改进,让模型更专注学习手术视频中的运动和中高层语义信息,实现了更高效的自监督训练方法。

该模型支持13种人类主要器官、6大类手术理解任务,包括工作流理解、动作理解、深度估计、息肉分割、三元组识别、技能评估,尤其在手术流程识别、器械交互理解、精细动作建模等核心任务上大幅超越现有方法。其背后的SurgMotion-15M预训练数据集汇集了来自50个数据源、13个解剖区域的3658小时手术视频,涵盖腹腔镜、开腹、神经外科、眼科、耳鼻喉科等多专科场景,为模型提供了前所未有的多样性支撑。

赋能临床,开源共享:构建通用手术AI新生态

发布会上,香港大学深圳医院神经医学中心名誉顾问医师潘伟生教授展示了“术影”在神经外科培训领域的应用验证。拥有35年临床经验的潘伟生教授表示,香港大学深圳医院作为神经外科专科培训基地,一直致力于解决复杂手术教学中传统“师带徒”模式的标准化难题。此次验证的“术影”大模型在多中心临床数据中准确率高达90%,在公开的JIGSAWS手术技能评估数据集中,其评估误差降至最低的2.649,与专家评分的相关性高达0.770,性能远超同类模型。

中山大学附属第一医院呼吸与危重症医学科副主任廖槐教授则展示了该模型在呼吸介入治疗领域的应用。廖槐教授认为,医学学习需要多方面积累,医生在具备一定医学基础和能力之后再借助AI,可以提升工作效率。他特别提到,通过增强现实技术,模型可以自动生成初步报告、快速标记病灶,“你拍好一张图片,它会立刻分析出图片信息,并自动提炼出来,医生只需再审核即可”。

在测试中,结合中山一院真实的临床视频数据,呼吸介入治理流程识别达到85%左右的准确率。“这一技术能将经典手术中的关键信息提炼并结构化,让医疗更加同质化,帮助来自基层的医院、医生获得指引。”

CAIR主任刘宏斌研究员表示,此次发布的“术影”手术视频大模型全面开源,旨在助力构建大湾区AI医疗的智慧生态,研发始终以临床应用为核心目标。“开源是为了让更多生态人员参与其中,并且各自贡献力量。目前很多问题尚未解决,需要大家齐心协力完成这件事情。”他表示,未来AI系统应是一个大型具身智能框架,其中包含一个核心基座用于调动工具,而“术影”目前虽已覆盖13个领域,但仍有许多未解决的问题,希望更多机构能够使用这个模型,共同分享实际应用场景中的痛点和难点,推动底层技术的持续突破。

采写:南都N视频记者 王道斌

相关内容

热门资讯

原创 古... ## 一块古老的陨石可能是一颗消失的原行星仅存的残骸。图片来源:库存图片 从撒哈拉沙漠发现的一块稀...
原创 6... 等等党终于迎来捡漏的好时机,现在618活动的最后一波,很多手机的价格再次跳水,目前不少高性价比手机价...
深天马A:公司深耕面板显示技术... 证券日报网讯 6月15日,深天马A在互动平台回答投资者提问时表示,公司深耕面板显示技术领域四十余年,...
AI“坐诊”:“带不走的医疗队... “眼底一张照,眼病全知道,一眼知全身”;2400万份高质量病例训练出的AI儿科医生智能体为150余家...
“核”去何从?一颗杏核的“闭环... 5月19日,河北平泉,天刚亮。承德亚欧果仁有限公司的杏核破碎车间已经轰鸣起来。高13米、长100多米...
奥普托科申请图像处理方法专利,... 国家知识产权局信息显示,北京奥普托科微电子技术有限公司申请一项名为“一种图像处理方法、设备、存储介质...
中兴通讯申请通信调度方法专利,... 国家知识产权局信息显示,中兴通讯股份有限公司申请一项名为“通信调度方法、通信设备及计算机可读存储介质...
数据资产化提速 数据保险站上风... 近日,国家数据局发布《关于推进行业高质量数据集建设行动的实施方案》(以下简称《实施方案》)。《实施方...
AI问诊靠谱吗?出事责任咋定? 随着AI工具的日益普及,“遇事问AI”正逐渐成为一种大众新常态,有医生在社交平台发帖称,患者当面打开...
包头市:首批78个应用场景面向... 6月5日上午,包头市正式发布《包头市推进场景建设和创新应用工作实施方案》及首批78个应用场景清单,面...