
作者:十九
编辑:李宝珠
转载请联系本公众号获得授权,并标明来源
日本早稻田大学团队运用两种类型的机器学习技术——LASSO 回归和贝叶斯优化,进行光驱动晶体的分子设计和实验优化,成功实现光驱动晶体阻挡力的最大化。
光驱动有机晶体 (Photo-actuated organic crystals) 在受到光照时能够发生形变,这种将外部刺激转换为机械运动的能力使其成为制备执行器材料 (Actuator materials) 的优选对象,尤其适用于制造轻质且可远程控制的执行器,有望在机器人和医疗设备等领域得到广泛应用。
如上所述,当光驱动晶体发生形变时,物体能够施加力并做功,在这种情况下,当晶体的自由形变被完全阻止时,会产生一个最大力,这被定义为阻挡力 (blocking force),有效控制光驱动晶体的阻挡力对于其实际应用至关重要。例如,最大化阻挡力能够拓宽光驱动晶体的潜在应用。现如今,研究人员可以通过调节光强度产生较小的力,但如何提升最大力仍然是个挑战,因为最大力涉及到晶体特性、晶体尺寸和实验条件等多种因素,这些参数与产生的力之间的关系尚未完全明确。
近日,日本早稻田大学团队运用机器学习技术进行光驱动晶体的分子设计和实验优化,成功最大化阻挡力。该研究以「Machine learning-driven optimization of the output force in photo-actuated organic crystals」为题,发表在 Digital Discovery 上。
具体而言,研究人员首先采用 LASSO(最小绝对收缩和选择算子)回归进行分子设计,并基于此合成化合物晶体,构建了一个具有不同杨氏模量和晶体尺寸的材料库。其次,利用贝叶斯优化从该材料库中高效采样,并通过实验测得最大化阻挡力为 37.0mN。这种方法的效率是传统网格搜索法的 73 倍,极大地提升了光电机械分子晶体的适用性,并有助于优化功能晶体的其他特性。
论文地址:
https://go.hyper.ai/RU0ro
关注公众号,后台回复「光驱动晶体」获取完整 PDF
开源项目「awesome-ai4s」汇集了百余篇 AI4S 论文解读,还提供海量数据集与工具:
https://github.com/hyperai/awesome-ai4s
从 118 篇论文中收集 393 个数据点
研究人员通过使用有机晶体、杨氏模量和分子晶体、杨氏模量作为关键词,在 Google Scholar 上进行了检索。在数据整理时搜索到了 118 篇至少提及一个杨氏模量值的论文,并确定了这些值主要是通过纳米压痕法获得。
* 杨氏模量是衡量材料抵抗形变能力的一个物理量,其值越大,材料越不容易发生形变。
* Youngs Modulus 杨氏模量数据集下载地址:
https://go.hyper.ai/igaoF
由于在许多情况下,文献提供了材料多个方向的测量值(例如,沿不同的晶体学轴),因此,研究人员提取了每个相关的数据点,还纳入了弯曲测试数据和其他测量数据,以确保数据集的全面性。最终,得到了一个包含 393 个数据点的数据集。
* 可以通过测量晶体在不同方向上的杨氏模量来表征材料的各向异性。
两种机器学习包含 LASSO 回归、贝叶斯优化
如下图所示,在所收集的数据集基础上,研究人员利用 LASSO 方法设计晶体分子,并制备所设计的晶体 (Crystal preparation),通过一系列实验,如 X 射线分析、紫外可见光吸收测量、纳米压痕法实验、弯曲实验等,分析制备晶体的结构特征、测量其杨氏模量,并建立具备不同杨氏模量和晶体尺寸的材料库。随后,利用贝叶斯优化 (Bayesian optimization) 开展晶体取样,迭代测量不同晶体的最大阻挡力。
本研究的工作流
总而言之,两种机器学习方法研究了杨氏模量与官能团之间的关系,可以确定最佳实验条件。而人类研究员的任务是准备晶体样品、进行实验分析,测试真实世界中晶体的最大阻挡力等。
合成 10 种光驱动有机晶体,并最大化晶体阻挡力
用 LASSO 方法成功设计光驱动有机晶体
由于水杨醛胺分子 (salicylideneamine molecule) 具备光驱动晶体的功能,研究人员将其作为目标对象。在起初的水杨醛胺分子设计方面,研究人员探索了分子亚结构与杨氏模量之间的关系,其目标是建立一个具有不同杨氏模量和晶体尺寸的水杨醛胺晶体材料库。
制备水杨醛胺分子的化学反应式
具体而言,研究人员对所收集的 393 个数据点的数据集进行分子结构向量化。除去解释变量中相关性较高的变量后,其发现 18 和 27 个亚结构分别与杨氏模量呈正相关和负相关,比如,形成氢键的亚结构与杨氏模量呈高度正相关。
为进一步优化分子设计,增强可解释性是必要的。研究人员采用 LASSO 回归,这是一种既能进行变量选择又能实现线性建模的方法。在进行超参数优化、评估 LASSO 准确性、测量实验误差等措施后,如下图所示,LASSO 模型最终保留了 7 个具有正负相关的变量,其中 4 个变量(脂肪族羟基 Aliphatic hydroxyl groups、硝基 Nitro groups、羧酸 Carboxylic acids、氨基 Amino groups)是可能增加杨氏模量的亚结构,也就是正相关,另外 3 个变量(芳香族羟基 Aromatic hydroxyl groups、卤素 Halogens、苯环 Benzene rings)是可能降低杨氏模量的亚结构,即负相关。
LASSO 回归保留变量的回归系数
基于从 LASSO 回归获得的正负关系,研究人员合成了水杨醛胺分子(适当更换上述不同的亚结构),最终得到 10 种不同的化合物。
制备的 10 种化合物
所有制备的化合物均以板状形态结晶,晶体尺寸各异,研究人员对这些晶体结构进行了 X 射线分析,结果如下图所示。
水杨醛缩胺化合物的晶体结构
(a-j) 化合物 1-10 的晶体结构按顺序排列
除了对这些化合物进行紫外可见光吸收测量 (UV-visible absorption measurement) 等。研究人员还使用纳米压痕法、弯曲试验分别测量晶体沿厚度、纵向方向的杨氏模量,结果如下图所示。
左图 a 表明,晶体化合物 1–3 的杨氏模量大于化合物 4–6 的杨氏模量,这与 LASSO 的预测一致。然而,卤化晶体(化合物 7–10)与预测不一致,化合物 7–9 的晶体具有相对较大的杨氏模量,这是因为所收集的数据集中包括形成卤键且杨氏模量相对较小的卤代晶体,但本研究中的卤代晶体并未形成卤键。
通过纳米压痕(左)和弯曲试验(右)测量杨氏模量
上图 b 表明,在厚度方向上杨氏模量较大的晶体往往在长度方向上具有较小的杨氏模量,这可以归因于有机晶体的各向异性,当某一方向上形成强相互作用时,较弱的相互作用将成为其他方向的主要分子间相互作用。
总而言之,研究人员揭示了分子结构与杨氏模量之间的关系,为水杨醛胺分子构建了一份设计指南。
贝叶斯优化高效采样,最大化晶体阻挡力为 37.0mN
在建立了具有不同杨氏模量和晶体尺寸的材料库后,研究人员通过贝叶斯优化从该材料库中采样,并光照射下测试晶体阻挡力,测量过程如下图所示。
阻挡力的测量过程
起初,研究人员测量了 10 个点(两种晶体的 5 种光强条件),其中最大值为 Fmax = 9.8 mN(Fmax 定义为最大阻挡力减去初始载荷)。随后,研究人员用贝叶斯优化开展晶体取样,并迭代测量 Fmax,发现在 100 次实验过程中,Fmax 逐步攀升。
如下图所示,Fmax 从 9.8 mN 逐步提升至 16.0 mN、26.8 mN、34.4 mN,最终达到 37.0 mN。值得注意的是,Fmax 在最后 3 次数值的增长中呈现出逐渐放缓的趋势:从 26.8 mN 升至 34.4 mN 的增幅为 7.6 mN,而从 34.4 mN 到 37.0 mN 的增幅为 2.6 mN。尽管继续实验仍可能带来一定的力值提升,但其增长幅度将愈发有限,此外,最后 3 次 Fmax 均在类似条件下通过化合物 3 的晶体实现,这也强烈表明当前参数空间内的优化已接近全局最大值。
通过贝叶斯优化,不同晶体最大阻挡力的变化
值得一提的是,用于本次力测量的材料库包含 8 种晶体(排除化合物 6、7),但化合物 3 表现出最卓越的性能,在优化过程中也被选择得最多。
优化实验期间测量的化合物频率
以上可能归因于化合物 3 独特的结构特征:
* 其水杨基平面与苯基平面之间的较大二面角 (51.58°) 实现了高效的光异构化,而硝基增强了光响应性。
* 沿厚度方向堆叠的分子层促进了各向异性热膨胀。
* 化合物 3 在光照下表现出烯醇-酮光异构化和热效应。
* 在薄晶体中,光异构化导致晶体向背离光源的方向弯曲,而在厚晶体中热膨胀占主导。
* 晶体的负热膨胀系数沿着长度方向接近室温可能有助于整体的机械响应。
* 在光强充足的区域,力的产生随晶体尺寸的增大而增强。
总而言之,通过应用两种机器学习模型,本研究成功地将光驱动晶体的阻挡力提升到了一个新的高度,超过了先前报道的最大值(约 10mN)。
其中,LASSO 回归揭示了光驱动有机晶体某些亚结构与杨氏模量之间存在的正负相关性,比如,容易形成氢键的亚结构被认为是正相关的因素,而苯环和卤素则被视为可能的负相关因素,这些发现使研究人员能够选择适当的水杨醛胺衍生物亚结构。
而贝叶斯优化方法对选定的晶体进行力测量取样,实现了高达 37.0mN 的阻挡力,假设该数值代表参数空间中的全局最大力,则本研究的探索效率至少是传统网格搜索法的 73 倍。
贝叶斯优化在材料科学领域的革命性潜力
本研究所采用的贝叶斯优化收敛于晶体特性和尺寸的特定组合,这表明在最大化阻挡力方面,晶体特性和尺寸之间存在最佳平衡,单纯选择最大的晶体尺寸并不是最大化阻挡力的最优方案。该方法为光驱动晶体力输出树立了新标杆,也为其他分子晶体系统的材料优化提供了一个通用框架。
除了上述研究之外,贝叶斯优化凭借其高效的数据利用能力、全局优化特性和对复杂约束的适应性,在材料科学的多个领域也展现了革命性潜力。
比如,多伦多大学团队采用多目标贝叶斯优化 (MBO) 算法,结合高 sp² 键合纳米尺度热解碳,制造出了具有超比强度和可扩展性的轻质碳纳米晶格。该研究以「Ultrahigh Specific Strength by Bayesian Optimization of Carbon Nanolattices」为题,发表在 Advanced Materials 上。
* 论文地址:
https://advanced.onlinelibrary.wiley.com/doi/10.1002/adma.202410651
此外,瑞典团队通过集成自动化纽扣电池组装、LiFePO4||Li4Ti5O12 和贝叶斯优化,成功探索了一个包含 4 种共溶剂和两种锂导电盐的有机水系混合电解液系统,证明了将贝叶斯优化与自主全电池实验相结合的潜力,也为下一代水性电池提供了新的电解质设计见解。该研究以「Accelerating aqueous electrolyte design with automated full-cell battery experimentation and Bayesian optimization」为题,发表在 Cell Press 上。
弗吉尼亚理工大学开发了一种贝叶斯反应优化和分析框架,使得高分子化学家能够将先进的优化算法集成到高分子立体选择催化剂的筛选和优化实践中,标志着贝叶斯优化在高分子化学合成中的重大突破。该研究以「Bayesian-optimization-assisted discovery of stereoselective aluminum complexes for ring-opening polymerization of racemic lactide」为题,发表在 Nature Communications 上。
* 论文地址:
https://www.nature.com/articles/s41467-023-39405-5
总而言之,使用贝叶斯优化、或将贝叶斯优化与与其他方法组合,材料研发有望突破传统方法的效率瓶颈,实现多尺度、多目标的高效探索与精准设计。


戳“阅读原文”,免费获取海量数据集资源!
(文:HyperAI超神经)