有效性达95.5%,Deep dreaming方法可逆向设计MOF,探索材料化学空间
创始人
2025-06-05 12:01:00
0

编辑丨%

探索金属有机框架(MOFs)这一庞大且尚未充分利用的化学空间,有望在材料科学领域拓展出一片更广阔的学术空间。

其中,MOFs 以模块化著称,以前所未有的灵活性根据特殊需要定制功能。但在面临如此庞大的空间,如何进行有效地「分子导航」成为了一个问题。

英国曼彻斯特大学(University of Manchester)采用了一种名为「deep dreaming」的方法,在虚拟空间优化 MOFs,试图从一开始就生成系统性地接近目标功能的结构。

该研究以「Inverse design of metal-organic frameworks using deep dreaming approaches」为题,于 2025 年 5 月 26 日刊登于《Nature Communications》。

论文链接:https://www.nature.com/articles/s41467-025-59952-3

Deep dreaming

具体来讲,Deep dreaming 是一个可解释的框架,整合了性质预测与结构优化,采用专门的化学语言模型,聚焦于发掘在碳捕获和能源存储等应用中至关重要的 MOF 性质。

时至今日,实验中合成的 MOFs 数量已经超过了十万种,但有机连接体的广阔化学空间暗示了几乎无限的 MOF 组合可能。

高通量计算筛选(HTCS)常用于寻找特定应用的有前途的 MOF 候选物。这种方法从一系列结构中选取具有特定关键指标的材料,但也会落入已知材料的性质会与目标有偏差的困境。

因此,在 HTCS 中提供一个显著扩大的潜在结构选择至关重要,这有助于研究人员能在合成材料时考虑到最佳的组合。

Deep dreaming 方法先仅使用标记数据来训练机器学习模型,预测分子属性从字符串表示。然后,通过「inceptionism」技术将机器学习架构反转,从而修改输入以达到目标属性值,进而在过程中创建新的分子。

这种技术提供了一种扩展给定应用可能候选材料池的方法,还提供了对模型理解的可解释洞察。在逆向训练过程中,模型的预训练权重和偏置被冻结,输入通过梯度下降逐步修改为新的、最优的特征向量。

团队扩展了用于逆向设计 MOFs 的方法,以恢复优化过程。考虑到任务中元素的独特作用,团队参考了 Bucior 等人提出的 MOF 识别方案,将他们的 MOF 字符串分为三类表示:

(1)边缘 SBU 表示,使用 Group SELFIES 字符串来描述重要的化学亚结构,如功能基团和芳香环;

(2)节点 SBU 表示,使用 SELFIES 字符串描述;

(3)拓扑表示,使用 RCSR 代码描述。

这些元素共同捕捉了 MOFs 的化学和部分拓扑特征,但不包含任何结构细节。虽然这种方法在表达能力上可能不如基于结构的模型强大,但它可以通过简单的字符串操作在逆向过程中高效地探索性质空间。

图 1:Deep dreaming 模型和金属有机框架(MOF)字符串表示。(图源:论文)

接着,团队使用 PyTorch(v.2.2.1)开发了一种适用于复杂序列到回归任务的机器学习架构,结合了长短期记忆(LSTM)网络和注意力机制。

通过引入自注意力机制,模型可以专注于输入序列中与当前回归任务关联性最高的部分。如此操作能提高模型的物理可解释性,在推理过程中应用注意力权重可以揭示 MOF 字符串中不同标记的重要性及其对模型预测的贡献。

最后,从两个 LSTM 分支获得的向量被连接起来,并通过 MLP 得到最终的性质预测。虽然每一种组合由于算法原因在化学上都是可行的,但并非每个样例都代表有效预测。

图 2:使用 Deep dreaming 方法逆向设计工程金属有机框架(MOFs)。(图源:论文)

优化 MOF 结构

在这个部分,团队使用直观的优化轨迹(如比表面积 VF)对单个 MOF 进行实验。实验的出发点是基于 VF(以及其他结构特征)与 MOF 功能的密切相关性。团队期望在增加 MOF 的 VF 的模型训练中发现类似的优化策略。

为进一步探索这一想法,研究人员决定让模型最大化 MOF 的 VF,从一个基点 MOF 结构开始,模型将在数百个训练周期中对边 SBU 编码进行微小调整,对应 deep dreaming 过程。

后续进程里,有效的转变路径被定义为一系列成功的连接分子修改,而转变路径则指模型建议的所有修改,无论是否有效。通过检查有效的转变路径,可以清楚地看到从初始种子结构到最终解码结构的连接点之间的延伸,一些无效的连接分子将会被剔除出考虑范围。

图 3:优化单个金属有机框架(MOF)结构。(图源:论文)

在每次迭代中,基点 MOF 都会被转换成具有扩展孔隙空间的结构。因此,尽管轨迹在多次重复试验中可能会有所不同,但设计策略保持一致。这里可以将这些结果解释为一系列局部优化,再从局部中择取最优的结构选项即可获得全局最优结果。

值得强调的优势

Deep dreaming 的过程实际上赋予了它较高的物理可解释性。对于 VF 的具体情况进行直接预测可以得到「连接体越长,VF 越高」的一般结论,但这个解读过程对于机器学习的洞察过程来说往往比较复杂。

通过使用直接对应于化学结构的 MOF 字符串,团队可以确保特征不仅具有物理意义,而且可复制:经验丰富的化学家,配备适当的实验工具,可以复刻出模型建议的连接体修饰。

与 Sm-VAE 等模型相比,尽管限制了设计范围,但 deep dreaming 方法使用相对较少的训练数据实现了高有效性(~95.5%) 和唯一性(~99.4%)。

原则上,设计团队可以通过模仿模型的自动化优化策略,对有价值的设计规则加以推导。

借助这种能力,deep dreaming 可以同时在科学发现和理解方面实现双重目标,从而照亮人工智能的「黑箱」,并朝着更具解释性的人工智能迈进。

相关内容

热门资讯

从贝壳到防弹衣:仿生材料如何改... 为什么荷叶能“出淤泥而不染”?蜘蛛丝为何具有卓越的强度?这些自然界的奇迹,正启发着科学家开发出一系列...
群力橡塑取得进气管定位机构专利... 金融界2025年6月6日消息,国家知识产权局信息显示,上海群力橡塑制品有限公司取得一项名为“进气管定...
微短剧“出海”还需巧借力(文化... 作为影视行业的“新风口”,微短剧不仅在国内大火,也俘获无数海外观众的心,成为中国文化出海“新三样”(...
看AI如何织密小散工程安全防护... 走进东莞厚街的一处民房的施工现场,大疆无人机与传感器正以厘米级精度进行三维建模,AI摄像头自动识别施...
国产厂商最新旗舰机激活量排名 ... 【CNMO科技消息】6月6日,博主“数码闲聊站”公布了一组国产旗舰机累计激活量数据,小米在销量上已经...
为何选择阿里算力合作伙伴能降低... 选择阿里算力合作伙伴能够降低阿里云服务器报价的原因主要体现在三个方面:通过多级代理体系,合作伙伴能够...
当传统婚介接入AI:优化精准配... 东方网记者熊芳雨6月6日报道:人工智能时代,AI技术如何赋能婚恋服务?昨天下午,一场以“落地与破局,...
四川:省领导带头,3万余名领导... 有一种热,叫“AI热”。特别是随着生成式人工智能技术的发展,这股热度正持续上升。 高校和科研院所众多...
广东省人工智能与机器人产业联盟... 6月6日,由广东省委统战部、省工商联牵头,会同省直相关单位组建的广东省人工智能与机器人产业联盟正式在...
中端机皇降临,vivo S30... 中端手机市场迎来重磅炸弹!vivo S30系列自5月29日发布便引爆全网,如今正式全渠道开售,以“全...