近日,我系李金金团队(人工智能与微结构实验室(AIMS-Lab))在物理学顶级期刊《Physics Reports》上发表了题为《Machine learning accelerates quantum mechanics predictions of molecular crystals》(机器学习加速分子晶体的量子力学预测)的综述论文,详细论述了近年来全原子量子力学计算、基于片段的分块算法、基于机器学习的量子计算以及基于机器学习的软件或程序包在分子体系中的最新进展,为机器学习在加速量子计算、结构优化以及新材料设计等方面提供了新的平台和解决思路。
量子力学(QM)方法(DFT、MP2、CCSD(T)等)在计算分子和晶体方面发挥了重要作用,具有很高的精度。近年来,随着人工智能技术的发展,机器学习在加速分子晶体的量子计算、预测以及新材料的发现方面发挥了越来越重要的作用。该文章提供了量子力学理论、基于片段的分块方法和机器学习算法的最新进展,以及这些方法在预测无机小分子、大药物分子和相关分子晶体方面的最新应用。论述的应用包括机器学习势能面(PES)的构建、晶体结构预测、化学反应预测和性质预测,如结构、能量、原子力、键长、化学位移、超导性、超硬度、振动光谱、相变和相图等。
这项工作还回顾了近年来建立的基于机器学习算法的软件和程序包,用于物理和化学领域的性质预测和势能面构建。可以预见的是,在机器学习算法、高质量的数据采集和数据特征表示方面的快速发展将显著提高化学位移等其他分子属性预测以及势能面构建的准确性和效率。此外,一系列数据驱动的软件和软件包将促进机器学习模型的发展和在更广泛领域中的应用。
图1: 全原子量子计算(QM)、基于片段的分块量子计算和机器学习(ML)驱动的量子计算方法和应用的示意图。
图2: 基于机器学习(ML)的量子计算方法在计算化学和物理中的应用工作流程,包括数据收集、特征工程、模型构建和模型应用。
图3: 适用于化学和物理的三类机器学习(ML)应用模型。(a)直接预测化学性质的正向模型,针对不同的预测构建不同的ML模型(ML1、ML2 等);(b) 通过构建势能面(PES)模型预测特性的;(c) 构建基于机器学习(ML)的电子密度或波函数的交换和相关泛函 (MLfunc) 以预测基态性质的混合模型。
图4: 结合 NN PES 和基于片段的方法来预测分子晶体的能量和各种性质的方法的流程图
图5: 不同类型分子和相应机器学习势能面(PES)的概述
表1: 机器学习(ML)在构建势能面(PES)方面的应用
表2: 使用机器学习方法计算化学/物理学的软件和软件包,包括程序名称、作者和发表年份、程序类型、程序中使用的方法和主要功能
《Physics Reports》(影响因子25.6)是国际物理和交叉科学的顶级期刊,每期只发表一篇论文。该期刊不接受自由投稿,由期刊编辑部邀约在相关领域做出突出贡献的学者撰写相关综述,对相关领域的发展具有重要的引领和指导作用。李金金团队致力于量子计算、量子分块算法以及机器学习算法的研究,在相关领域发表高水平论文100余篇,受邀在《Physics Reports》期刊发表长篇综述论文介绍相关领域的最新研究进展。
上海交通大学为该论文唯一通讯单位,上海交通大学电院微纳电子学系2017级博士生韩彦强为本论文的第一作者,李金金老师为该论文的通讯作者。该研究获得国家自然科学基金委、上海交通大学等的资助。
论文链接:https://www.sciencedirect.com/science/article/pii/S0370157321003240