Nature|运用贝叶斯优化高效优化合成条件

  • A+

今天给大家分享一篇最近发表在Nature上的研究,题为:Bayesian reaction optimization as a tool for chemical synthesis,文章的通讯作者是普林斯顿大学的Ryan P. AdamsAbigail G. Doyle教授。

1. 左:优化化学反应的一般方法;右:贝叶斯优化的一维展示


    化学反应条件的优化对于基础研究与工业生产都至关重要,优化的反应条件能够极大的提高合成效率并减少能源与材料的浪费。但此过程并非易事,一个反应往往存在许多条件参数,比如:催化剂、温度、反应时间、溶剂以及浓度等,而在传统的化学实验室中,科研工作者所能开展的实验数目有限,无法遍历所有可能的实验参数,因此传统优化过程往往极大的依赖于化学家们对反应的机理的认识以及过往的经验(文献)。随着自动化技术的发展,人们能以更高的通量对反应进行尝试,但是面对巨大的化学空间(chemical space),通过最少的实验量从中寻找最优的反应条件仍然极具挑战,尤其在面对全新反应的时候。在本文中,作者借助贝叶斯优化算法发展了一种高效的反应优化策略,结合所开发的开源软件,实现了更为高效的反应优化过程。

2. 用于优化参数的反应


贝叶斯反应优化的主要思路为:首先通过文献或实验获得初始数据,运用其训练代理模型(surrogate model);随后通过优化采集函数(acquisition function)从所训练的模型中找寻新的反应条件,使得期望效益(expected utility)最大化(图1);最后,开展实验并用实验结果再次训练代理模型,如此循环直至得到理想的实验结果。虽然该算法思路明确,但是在运用到化学反应优化中仍要解决许多实际应用问题。

作者开发了一个程序包(EDBO)用于开展整个流程,并运用此前已经发表的反应数据对其进行优化,主要确定三点参数:描述符,代理模型以及采集函数。为了能够在计算机中对化学空间进行描述,他们尝试了不同的描述符,并发现基于密度泛函理论(DFT)的描述符能够得到较为一致的预测结果。他们进一步对于不同模型的预测效果进行了评价,最终确定一个高斯过程模型(核函数为Matérn52)具有理想的代理模型效果。通过平衡探索(exploration)与利用(exploitation)的关系,多次尝试后作者确定了采集函数以及采样策略,并在现有数据中进行了验证。

3. 钯催化的咪唑的芳香化反应用于效果的评估


接下来,作者对该方法的效果进行了探究。他们选取了一个钯催化的咪唑的芳香化反应(图3),利用自动化技术对其中关键反应参数组合进行了遍历(12种配体,4种碱,4种溶剂,3个反应温度以及3个浓度,共计1728种组合)。随后他们设计了一个游戏,邀请50位化学专家对该反应进行优化,模拟真实的实验条件:在一个月内,每个工作日只能开展5个反应。主要结果如图3所示,专家们在初始条件选择上往往占优,但3天后算法所选条件的产率平均水平开始高于人类。值得注意的是,算法最终能够达到99%以上的收率,而许多人则认为反应无法优化而在达到99%前放弃。该方法能够在对全局进行优化,作者发现其所运用的一种配体在此前并没有人将其直接用于咪唑芳基化反应。

4. Mitsunobu反应进行优化


随后,作者将该方法应用于不同的反应体系中。运用该方法他们成功的在410次实验后将一个Mitsunobu反应产率优化至99%,从180000种可能的组合中找到了优化的反应条件。他们也对一个氟代反应进行了优化,经过35次实验后,成功的将产率由35%提升至69%

总结来说,作者基于贝叶斯优化发展了化学反应的优化方法,能够帮助人们在复杂的化学空间中快速找到较优的反应条件,是机器学习在化学领域又一有趣的应用。


作者:Roy Wu    审校:XW


Shields, B. J.; Stevens, J.; Li, J.; Parasram, M.; Damani, F.; Alvarado, J. I. M.; Janey, J. M.; Adams, R. P.; Doyle, A. G., Bayesian reaction optimization as a tool for chemical synthesis. Nature 2021, 590 (7844), 89-96.

Link: https://www.nature.com/articles/s41586-021-03213-y


weinxin
我的微信
关注我了解更多内容

发表评论

目前评论:0