网状材料的结晶(如MOFs、COFs和ZIFs)至关重要,因为它能构建有序多孔结构,实现水资源收集、二氧化碳捕获等重要应用,并可通过单晶X射线衍射解析原子级结构,揭示结构-性能关系,指导材料开发。尽管网状化学已有数十年发展,新框架的结晶仍主要依赖经验。虽然可基于几何原理合理设计结构单元,但具体哪些组合能结晶、在何条件下结晶,仍依赖反复试验,效率低下,导致大量化学空间未被探索。这不仅错失了可能具有突破性的材料,也限制了对结晶过程的基本理解,阻碍了人类直觉与机器学习模型的开发。
新材料发现的核心挑战在于如何高效分配有限实验资源,以最大化发现不同晶体的数量,而非优化单一材料或提高成功率。传统机器学习方法虽能处理数据并识别模式,却难以适应这一目标:它们多用于分类或优化已知系统,缺乏跨系统广泛探索与动态调整能力。贝叶斯优化、遗传算法等虽擅长寻找最优条件,却倾向于聚焦单一目标,难以实现多系统并行探索与灵活转向。因此,需要一种新方法:能够同时学习不同化学系统中的结晶规律,并基于持续学习的结果,动态、策略性地分配实验资源,从而高效推动新材料发现。
美国加州大学伯克利分校Omar M. Yaghi教授、Laurent El Ghaoui教授、Zichao Rong、澳大利亚莫纳什大学Mario Boley等研究人员介绍AIRES(算法迭代网状合成),这是一个集成循环,它将晶体发现从经验探索转变为系统决策,旨在最大化发现的独特新结构的数量。AIRES结合了自动化合成、用于晶体识别的计算机视觉和单晶X射线衍射(SCXRD)技术,并关键地加入了一个算法框架来决定后续实验。AIRES使用基于精心设计的化学描述符训练的概率机器学习模型来预测不同体系的结晶结果,从而实现跨系统学习,使一个化学家族的模式能够加速其他化学家族的发现。这些预测结果为基于理论的选择策略提供了支持:对于发现目标而言,贪婪地选择高概率候选结构优于以性质优化为最优目标的探索性策略。AIRES动态分配资源,立即排除成功的结构单元,专注于尚未发现的结构单元,同时不断从成功和失败中学习,以改进整个化学空间的预测。为了在高通量实验中实施这一策略,开发了一种基于原则的批次选择算法,该算法能够识别出预期发现最大化的实验集,同时考虑条件依赖性。这避免了简单地选择前k个候选结果所导致的严重冗余,因为这些候选结果通常具有相似的特征,提供的新信息有限。利用AIRES技术在ZIF上进行了验证,发现由48种新型连接基团中的10种构成的ZIF晶体,其效率是随机探索的两倍(700次实验对比1400次实验)。这使得单连接基团Zn-ZIF库的规模扩大了三分之一,打破了长达十年的发现荒。
相关研究成果以“Algorithmic iterative reticular synthesis of zeolitic imidazolate framework crystals”为题发表在Nature Synthesis上。

提出“算法迭代网状合成”闭环系统:集成自动化实验、图像识别、SCXRD 与算法决策,形成一个闭环的材料发现流程。目标不是优化单一材料性能,而是最大化发现新晶体结构的数量。将传统的“试错式”材料合成转变为系统化、目标驱动的探索过程。
面向“发现”的机器学习策略:采用贪婪选择策略,每次选择预测成功率最高的实验,而非传统贝叶斯优化中的“探索-利用平衡”。一旦某个连接体成功结晶,系统立即停止对其进一步实验,转向其他候选连接体,以最大化新结构的发现效率。
多特征编码与跨系统学习能力:使用多维特征描述符编码连接体结构和反应条件,包括官能团数量、连接体尺寸、量子力学性质(中性与去质子化状态)、预核种物种的量子力学性质。模型能够跨化学体系学习结晶规律,提升对未见连接体的预测能力。
在成熟体系中实现突破性发现:在ZIFs这一被认为“已充分探索”的体系中,AIRES 发现了10种新连接体,合成了11种新晶体结构,涵盖7种不同拓扑类型。将单连接体 Zn-ZIF 库扩大了三分之一,打破了该领域近十年的发现停滞。

图1.AIRES循环及其组成部分的示意图

图2.初始ZIF合成数据集

图3.AIRES在加速ZIF发现方面的性能

图4.AIRES利用新型连接体发现的ZIF和LZIF的拓扑分类和晶体结构
AIRES展现出超越单连接体Zn-ZIFs的巨大潜力。该系统易于扩展到多连接体ZIFs,但需要仔细的数据标记才能捕捉到不同的结果(单连接体或混合连接体结构)。除了ZIFs之外,AIRES还可以解决其他网状或更广泛的晶体体系中的结晶难题。核心机器学习方法——贪婪采集函数——具有广泛的适用性,尽管反应编码需要针对特定领域进行定制。随着复杂性的增加,增强表征至关重要;将单晶X射线衍射(SCXRD)与粉末X射线衍射(PXRD)和傅里叶变换红外光谱(FTIR)等多模态技术相结合,可以实现全面的分析并保持严谨性。AIRES在更广泛的发现生态系统中占据着独特的地位。首先,其验证的结构为构建预测结构-性质关系的机器学习模型提供了宝贵的数据。其次,AIRES的输出结果可作为下游可扩展材料开发的“结构锚点”。例如,AIRES确定的初始条件,以及根据已解析结构模拟的参考PXRD图谱,有助于实现两个关键的放大功能:物相鉴定和纯度评估。一旦验证,定量PXRD分析(例如峰宽)即可得出结晶度指数。该指标随后可驱动贝叶斯优化循环,系统地优化提高结晶度和减少杂质的条件,从而在发现和优化之间建立无缝连接。
原文链接:
https://doi.org/10.1038/s44160-025-00939-9
声明:仅代表作者个人观点,作者水平有限,如有不科学之处,请在下方留言指正!

来源|科学前沿阵地