人工智能中的开放性问题（AI）

在描述这些AI方法以及如何将它们用于化学，生物学和其他地方之前，考虑AI领域的一些“大图”问题是有益的。在与人工智能相关的许多悬而未决的问题中，与本文最相关的是生命如何与思想，机器和文化联系起来[11]：

在人工生命系统中展示智力和思维的出现。
评估机器对下一次主要生命转变的影响。
建立人造生命的道德原则。

开发先进的计算人工智能方法可能会在未来二十年内造成社会混乱，但它们应该带来前所未有的好处，例如改进的医疗诊断和更便宜的更有效的服务[12]。这些好处并非没有风险，因为迄今为止大多数强烈的破坏性技术已经证明了这一点。除了可能的社会和就业动荡之外，一些技术领导者还警告说，如果人工智能系统的开发和实施没有足够的思考和限制，其他主要的有害后果[13,14]。像所有强大的科学发现和技术一样，必须注意确保捕获它们非常可观的好处，并尽量减少其可能的误用。

机器学习和人工智能

在迄今为止开发的无数AI方法中，最有用和最主要的方法之一是机器学习。机器学习算法是一系列计算方法，其发现对象（例如，分子，材料，人）与这些对象的有用属性（例如，生物活动，熔点，硬度，信誉等）之间的关系。它们包括人工神经网络，决策树和其他几种生物学启发的计算算法。它们已应用于大多数科学和技术领域，并为化学及相关的分子和生物科学做出了重要贡献。例如，[15]。最近的另一个例子是机器人科学家亚当和夏娃通过定量结构 - 活动关系（QSAR）学习和生物测试循环自动化药物开发（图3）[16-18]。Eve的化合物选择比标准药物筛选更具成本效益，机器人科学家已经确定了几种对热带寄生虫有效的新药[19]。

神经网络是最广泛用于化学和相关研究领域的机器学习算法，例如药物和材料发现。因此，以下讨论涉及这些非常有用的算法，以及可能的范例转移称为深度学习的新变体。我们提供了这些类型的机器学习算法的简要概述，以帮助那些不熟悉它们的有机化学家。

传统的反向传播算法

常见的机器学习算法是反向传播神经网络。这是一个数学对象，通常由三层组成，每层包含可变数量的节点（参见图4））。将对象（例如分子）的数学表示应用于输入层节点。表示通过一组权重分配给执行非线性计算的隐藏层节点。通过隐藏层节点中的非线性传递函数对每个隐藏层节点的输入求和并进行变换。这些节点的输出被传输到输出层节点（可以有多个），其中权重被求和并用于生成输出。最初，权重设置为随机数。在训练期间，来自神经网络的预测输出与用于训练网络的分子的测量特性之间的差异产生误差。使用链规则向后传播这些误差以修改权重，以便最小化由神经网络生成的预测属性值中的误差。当神经网络的预测没有改善时，训练停止。虽然这些类型的神经网络工作得非常好，但它们确实存在一些问题，其中一些问题对于任何回归方法（例如，过度拟合）和一些特定于神经网络（过度训练，难以选择最佳神经网络架构）是常见的。虽然传统的反向传播神经网络无疑是有用的，但是通过额外的称为正则化的附加操作几乎可以完全消除它们的缺点，基本上对更复杂（非线性）的模型应用惩罚。

贝叶斯正则化神经网络

将正则化应用于神经网络或任何其他类型的回归涉及定义新的成本函数，该函数在回归算法运行时被最小化。下面列出的成本函数M描述了这种平衡，其中α和β参数调整模型预测中误差的相对重要性（β参数）和神经网络权重的大小（模型复杂度的度量，α参数）。

[图1]

其中N D是数据点的数量，N W是神经网络权重的数量（w j）。

非正则化模型使用仅包含与正常最小二乘准则对应的第一（误差）项的成本函数。在应用任何类型的正则化时，必须通过反复试验来确定α和β参数的最佳值。已经表明，贝叶斯统计可以用于找到α和β的最佳值，以生成具有最佳预测性能的模型。详细讨论超出了本文的范围，但可在其他地方获得[21-23]。

深度学习

最近，LeCun，Bengio和Hinton描述了一种称为深度学习的不同类型的神经网络AI方法[24]。与具有三层和少量隐藏层节点的浅层神经网络不同，深度神经网络具有若干隐藏层，每层具有数千个节点（参见例如图5））。他们没有像传统神经网络那样接受过训练，因为他们所包含的大量可调节重量会导致训练困难和过度拟合，严重影响他们的预测能力。相反，他们使用稀疏诱导方法，其涉及隐藏层节点中的“线性整流器”传递函数，以及随机重量丢失的实现。如果输入权重的总和低于给定阈值（例如，零），则线性整流器函数返回零，并且如果高于阈值，则返回输入权重之和的倍数。随机权重丢失涉及随机选择权重或隐藏层节点，在一个或多个训练周期中将它们设置为零。