2026 年 2 月 3 日,斯坦福大学刚毕业的两位博士 Kexin Huang(黄柯鑫)和 Yuanhao Qu(屈元昊)创立的 Phylo 公司宣布完成 1,350 万美元种子轮融资,由 Andreessen Horowitz(简称 a16z)与 Menlo Ventures 旗下与 Anthropic 合作的 Anthology Fund 联合领投。这笔投资的背后,是一款名为 Biomni 的开源生物医学 AI 智能体——它正试图重新定义生物学家与计算工具之间的关系。
黄柯鑫师从斯坦福计算机科学教授 Jure Leskovec,后者的研究组在图神经网络和大规模机器学习领域影响深远;屈元昊则师从斯坦福病理学教授、《麻省理工科技评论》“35 岁以下科技创新 35 人”中国区入选者丛乐(Le Cong),丛乐是 CRISPR 基因编辑技术的先驱之一,这两位导师同时也是 Phylo 的科学联合创始人。
此外,2022 年诺贝尔化学奖得主 Carolyn Bertozzi、CRISPR 技术先驱张锋(Feng Zhang)、计算生物学领军人物 Fabian Theis 等人也作为科学顾问加入了 Phylo。前 Benchling 首席战略官 Malay Gandhi 担任创始顾问,为公司的产品化和商业化路径提供指导。
图丨Phylo 创始团队(来源:Phylo)
在本轮融资宣布之前,我们与黄柯鑫进行了一次深入对话。他谈到了自己进入 AI for Biology 领域的契机、Biomni 的核心理念,以及他对这个交叉学科未来走向的判断。
从数学到 AI 科学家
黄柯鑫的研究兴趣并非始于 AI 热潮。他本科主修数学和计算机科学,大三时在洛克菲勒大学参与暑期实习,在 Lawrence Sirovich 教授指导下接触了计算生物学。
但真正让他下定决心深耕这个方向的,除了学术兴趣,还有一些个人层面的考量。他意识到,如果计算方法真的能在生物医药领域产生影响,那它解决的可能不只是抽象的科学问题,而是与自己切身相关的健康命题。
“我当时就想,能不能把自己的计算训练真正用到实际的事情上,做一些有影响力的工作,”他回忆道。这份对真实世界问题的关切,驱动他在此后近十年间持续探索 AI 在生物医药领域的应用。他先后在辉瑞、基因泰克、GSK、IQVIA、丹娜法伯癌症研究所等机构从事研究,积累了对产业界需求的深入理解。
图丨黄柯鑫(来源:受访者)
在斯坦福攻读博士期间,黄柯鑫师从图机器学习领域的知名学者 Jure Leskovec,发表了一系列高影响力工作。其中 TxGNN 是一个用于药物重定向(drug repurposing)的图神经网络基础模型,发表于《自然·医学》,能够在零样本条件下为缺乏现有疗法的疾病识别潜在治疗药物。
另一项名为 GEARS 的工作专注于基因扰动效应预测。这些研究的共同特点是:用 AI 模型去理解和模拟生物系统中复杂的因果关系,而非仅仅拟合统计相关性。
但黄柯鑫坦言,他始终有一个困扰。这些模型在论文中表现优异,却很难真正被生物学家使用。他做了大量工作,发布了各种机器学习模型和基础模型,在 benchmark 上效果都很好,但总觉得离“真的能用起来”还有距离。展示给生物学家看时,对方的反应往往是“这很酷”,可真让他们日常使用却无从下手。问题在于,这些预测模型对于科学家的日常研究任务来说是一种“增值服务”而非刚需,它们没有融入既有的工作流程。
转折点出现在 2024 年。大语言模型驱动的 AI 智能体(AI Agent)概念兴起。黄柯鑫意识到,这或许是打通模型与实际应用之间鸿沟的关键。智能体能够直接影响生物学家的日常工作,因为它本质上是在自动化那些繁琐的常规任务——做生信分析、查数据库、查文献、汇总信息。这些事情占据了研究人员大量时间,却并不需要太多创造性思维。
于是 Biomni 项目应运而生。
Biomni:生物学的集成开发环境
软件工程师有 IDE(Integrated Development Environment,集成开发环境),设计师有 Figma,分析师有 Excel,但生物学家从未拥有过一个真正属于自己的统一工作环境。科学文献分散在各种付费墙后面的 PDF 里,数据存储在 Excel 表格中,分析流程依赖 R 和 Python 脚本,数据库被困在形形色色的网页门户后面。科学家们不得不像急诊室的外科医生一样,手动缝合来自不同来源的碎片化信息,这个过程既低效又难以复现。
Phylo 想要构建的,是生物学领域的 IDE。Biomni 正是这一愿景的首个具体化产品。
Biomni 的技术架构由两部分组成。第一部分是 Biomni-E1,一个统一的生物医学“行动空间”。研究团队系统分析了 bioRxiv 上 25 个生物医学子领域的 2,500 篇近期论文,用 LLM 驱动的“行动发现智能体”从中提取完成各类研究任务所需的工具、数据库和软件。
经过人工专家验证后,他们构建了一个包含 150 个专业生物学工具、105 个软件包和 59 个数据库的环境,涵盖从湿实验 protocol 设计、AI 预测模型到领域知识 know-how 的方方面面。
图丨Biomni 中统一生物医学行动空间和 Agent 环境的概览(来源:bioRxiv)
第二部分是 Biomni-A1,一个通用型智能体架构。它接收用户的自然语言查询,通过检索系统选取相关工具,运用 LLM 推理生成分步计划,然后以可执行代码的形式完成每一步操作。与传统的函数调用方式不同,这种代码驱动的方法能够灵活处理循环、并行和条件逻辑,适应生物学研究中高度异质化的工作流程。
在论文中,研究团队展示了 Biomni 在多个真实场景中的表现。一位研究人员将 458 个 Excel 文件,包含 30 位受试者数月的可穿戴设备数据交给 Biomni,要求分析餐后体温变化模式。Biomni 自主生成并执行了 10 步分析流程,发现受试者进食后平均体温上升 2.19°C,且个体间存在显著差异。这项分析若由人工完成,预计需要三周;Biomni 用了 35 分钟。
单细胞多组学数据的处理更能体现系统的复杂任务执行能力。面对包含约 33.6 万个细胞核的 snRNA-seq 和 snATAC-seq 数据集,Biomni 完成了从数据加载、基因调控网络推断到转录因子活性分析的完整流程。
它不仅重现了原论文中已知的调控关系,还发现了 AUTS2、ZFHX3 和 PBX1 等转录因子在骨骼发育中此前未被充分认识的作用。整个过程耗时五个多小时,期间 Biomni 自行处理了变量名不匹配等执行问题,所有中间输出、代码、图表、日志,都被组织在可复现的文件夹结构中。
另一个代表性的案例是一项分子克隆任务。在该任务中,Biomni 被要求设计将靶向人类 B2M 基因的 sgRNA 克隆到 lentiCRISPR v2 Blast 载体中的完整 protocol。它自主完成了质粒分析、sgRNA 设计、引物设计、Golden Gate 组装条件设定和菌落筛选策略制定。
一位科学家严格按照 Biomni 生成的 protocol 进行实验,次日便观察到菌落生长,Sanger 测序确认 sgRNA 正确插入。在与人类专家的盲测对比中,Biomni 的表现与拥有 5 年以上经验的资深研究员相当,远超初级研究人员。
图丨Biomni 设计湿实验室实验方案(来源:bioRxiv)
通用架构的逻辑
Biomni 选择了通用型(general-purpose)架构,而非为每个任务构建专门的智能体。为什么不针对不同任务做专门优化?
黄柯鑫向我们解释了他的考量。“生物学里任务种类繁多,每个都不一样,甚至同一个任务换个问法就完全不同了。可以给每个任务都做一个专门的智能体,但这种方式根本没法规模化。”他们当时就在想,能不能设计一个通用型的架构,用一套系统解决各种各样的问题。
更深层的理由在于跨学科发现的可能性。他观察到,很多重要的科学发现往往发生在两个子领域的交界处,需要调用不同领域的知识和信息。专门化的智能体都是任务导向的,而通用型智能体可以桥接不同子学科,这样就有机会做出一些新发现。这一观点与科学史上的诸多案例相呼应:
CRISPR 的发现源于对细菌免疫系统的基础研究,而非定向的基因编辑技术开发;免疫检查点疗法的突破也来自对 T 细胞信号通路的基础探索。
当然,通用架构也有局限。黄柯鑫承认,在某些需要高度专业 know-how 的任务上,比如只有资深专家才掌握的实验技巧,当前的 AI 智能体仍难以企及。那些高精尖任务,需要很强的隐性知识积累,目前还做不到。
当然也有人质疑,生物学强调因果链条,而大语言模型本质上是在做模式匹配和相关性推断,它真的能胜任科学发现吗?
对于这一问题,黄柯鑫的看法是:“很多时候我们也不确定那是不是真正的因果关系。本质上可能还是相关性,只不过当相关性足够强的时候,我们才认为它是因果。”
生物学作为一门经验科学,知识增长本身就是通过大量证据的积累来实现的。今天发现 A 与 B 强相关,明天发现 B 与 C 强相关,逐步串联起来才形成对疾病机理的理解。从这个角度看,当前推理模型展现的能力或许已经足够支撑科学发现了。
让 Biomni Lab 成为电脑上的标签页
根据官方数据,自 Biomni 项目发布开源以来,其在不到一年已被超过 7,000 个实验室采用,包括全球 20 大制药公司中的 18 家。Phylo 的商业化路径是在开源版本基础上推出企业级产品 Biomni Lab,提供额外的安全控制、自定义 Agent 支持等功能。
a16z Bio + Health 团队领投此轮的合伙人 Jorge Conde 在投资备忘录中写道,他们认为 Biomni Lab 可以成为每个实验室、每台电脑上永远打开的那个标签页。当一个统一的环境成为所有科学研究的窗口时,发现的速度和连贯性将发生根本性改变。
在采访的最后,黄柯鑫谈到了他的长期愿景:五年、十年后,生物学家打开电脑第一件事就是使用类似 Biomni 这样的平台。早上先看昨晚智能体完成的任务结果,然后用自然语言写几条指令让它继续分析,自己则去做实验或者思考更有意思的问题。
这种人机协作模式类似于 PI(首席研究员)与研究团队的关系,一个科学家可以同时指挥十几二十个 AI agent 并行执行不同任务。常规分析都能被覆盖,这样,人类就可以专注在产生有意思的想法上。
这次融资距离 Biomni 论文发布仅八个月。从学术项目到商业公司的速度之快,也反映出当下 AI for Science 赛道的火热。但正如黄柯鑫所言,当前最大的非技术瓶颈或许是教育和信任——让更多生物学家理解并接受这种全新的研究方式,学会与 AI 智能体协作,并在过程中保持科学家应有的审慎。这是一种完全不同的工作模式,需要时间。
参考资料:
1.https://phylo.bio/
2.https://biomni.stanford.edu/paper.pdf
运营/排版:何晨龙