手术视频大模型“术影”开源发布,助力术者从看画面到懂操作
创始人
2026-03-25 17:40:39
0

3月24日,中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)在香港科学园深圳分园发布“术影”SurgMotion手术视频大模型。该模型基于涵盖约1500万帧、超3658小时真实手术视频的SurgMotion-15M数据集进行训练,在17个国际权威手术AI基准上全面刷新最优纪录,标志着手术AI从“碎片化识别”向“通用化理解”的跨越式进化,为临床治疗、手术操作、医学教学及术后复盘提供有力支撑。

从“看画面”到“看懂操作”:视频原生架构的范式革命

“术影”手术视频大模型突破传统像素重建的局限,引入运动引导的隐空间预测机制,显著提升了模型对手术器械、解剖结构、交互动作等关键语义结构的理解能力。据CAIR研究员易东介绍,研究团队在V-JEPA架构基础上引入运动引导的隐空间预测、特征多样性保持和模型稳定性保持三项技术改进,让模型更专注学习手术视频中的运动和中高层语义信息,实现了更高效的自监督训练方法。

该模型支持13种人类主要器官、6大类手术理解任务,包括工作流理解、动作理解、深度估计、息肉分割、三元组识别、技能评估,尤其在手术流程识别、器械交互理解、精细动作建模等核心任务上大幅超越现有方法。其背后的SurgMotion-15M预训练数据集汇集了来自50个数据源、13个解剖区域的3658小时手术视频,涵盖腹腔镜、开腹、神经外科、眼科、耳鼻喉科等多专科场景,为模型提供了前所未有的多样性支撑。

赋能临床,开源共享:构建通用手术AI新生态

发布会上,香港大学深圳医院神经医学中心名誉顾问医师潘伟生教授展示了“术影”在神经外科培训领域的应用验证。拥有35年临床经验的潘伟生教授表示,香港大学深圳医院作为神经外科专科培训基地,一直致力于解决复杂手术教学中传统“师带徒”模式的标准化难题。此次验证的“术影”大模型在多中心临床数据中准确率高达90%,在公开的JIGSAWS手术技能评估数据集中,其评估误差降至最低的2.649,与专家评分的相关性高达0.770,性能远超同类模型。

中山大学附属第一医院呼吸与危重症医学科副主任廖槐教授则展示了该模型在呼吸介入治疗领域的应用。廖槐教授认为,医学学习需要多方面积累,医生在具备一定医学基础和能力之后再借助AI,可以提升工作效率。他特别提到,通过增强现实技术,模型可以自动生成初步报告、快速标记病灶,“你拍好一张图片,它会立刻分析出图片信息,并自动提炼出来,医生只需再审核即可”。

在测试中,结合中山一院真实的临床视频数据,呼吸介入治理流程识别达到85%左右的准确率。“这一技术能将经典手术中的关键信息提炼并结构化,让医疗更加同质化,帮助来自基层的医院、医生获得指引。”

CAIR主任刘宏斌研究员表示,此次发布的“术影”手术视频大模型全面开源,旨在助力构建大湾区AI医疗的智慧生态,研发始终以临床应用为核心目标。“开源是为了让更多生态人员参与其中,并且各自贡献力量。目前很多问题尚未解决,需要大家齐心协力完成这件事情。”他表示,未来AI系统应是一个大型具身智能框架,其中包含一个核心基座用于调动工具,而“术影”目前虽已覆盖13个领域,但仍有许多未解决的问题,希望更多机构能够使用这个模型,共同分享实际应用场景中的痛点和难点,推动底层技术的持续突破。

采写:南都N视频记者 王道斌

相关内容

热门资讯

【兰小信·观】甘肃兰州:优化营... 关注我们 实验室里,研发人员专注推进微生物耐药检测技术攻关;生产车间内,工人们严格按照操作规程精准完...
高通大涨12%创历史新高,AI... 受投资者对AI边缘计算设备、汽车芯片及数据中心业务前景的押注推动,高通股价已触及历史高位,其在"物理...
双流企业领飞!成都首条常态化低... 红星新闻网(记者覃霞)5月22日报道22日10时许,4架中型八旋翼物流无人机从卡丁车公园起降点腾空而...
中海巢取得工商业用微型储能装置... 国家知识产权局信息显示,中海巢(河北)新能源科技有限公司取得一项名为“一种工商业用微型储能装置”的专...
东莞市虎门镇600千瓦供电车出... 这是(fadianji-huarui1780)整理的信息,希望能帮助到大家 # 供电车与发电机出租的...
宋钢谈加入小米:小米与特斯拉非... 【CNMO科技消息】近日,在YU7 GT小米人车家全生态新品发布会后,小米汽车副总裁宋钢对加入小米一...
金维制药申请甲钴胺纯化方法专利... 国家知识产权局信息显示,宁夏金维制药股份有限公司申请一项名为“一种甲钴胺纯化方法”的专利,公开号CN...
距今约2.42亿年!三叠纪最大... AI导读 News Today 晋中太谷发现2.42亿年前大型肺鱼化石,复原体长1.62米,系东亚现...
北京升级发布第二批“技能照亮前... 第二批技能照亮前程 北京升级发布 项目化培训指导目录 技能照亮前程 近日,北京市人力资源和社会保障局...
一川快评丨26年“非法跨境金融... 00 “反AI”标识 这篇不长,3分钟就能读完。 为了在茫茫多的万字AI解读中突出一点区分度,我们这...