(AI)帮助科学家方式的多样性与独创性有时甚至令该领域的专家都感到震惊。AI已经在科学研究过程的每个阶段都留下了印记:从生成假设到构建数学证明,再到设计和监控实验、收集数据、模拟和快速推理等。一些案例十分吸引人,比如AI帮助学者从旧的科学文献中发现新的科学见解,模拟不同的教育教学方法,编写更清晰的科学论文,甚至是研究AI本身。本文讨论了AI在科学中可以发挥的作用,并着眼于在不久的将来可能产生的影响。文章提到了人工智能想要在科学领域得到更广泛应用所需要克服的一些关键挑战,如因果推断和对于不确定性的处理。
科学家是一个特殊的专业群体,人工智能“夺走他们的工作”的前景,实际上却鼓励了他们。对知识的探索永无止境:人工智能每帮助回答一个问题,科学家们都会对更多的问题产生好奇。一旦有了发现,人们可能会寻求更根本的理解,了解为什么会有这样的发现,可能还想知道如何利用这些新发现的知识来帮助人类。
研究者对看似无关的科学领域之间的联系感到好奇。在过去的一个世纪里,科学变得极其专业化,如何在科学中使用AI的研究已经成为一个知识共享和跨学科工作的天然绿洲。例如,为了创建名人超分辨率图像而开发的AI工具实际上在材料科学中找到了应用。同时,在自动药物发现中的创新应用已经被发现与AI在理论物理中的应用类似。
各个领域之间的技术转移从未如此迅速。这是因为在AI应用的视角下,不同领域中看似无关的问题似乎有一个统一的主题(如数据聚类、异常检测、可视化和实验设计,任何科学领域都有共同的特点)。到目前为止,AI已经在科学研究的不同阶段得到了广泛的应用。
▲ 人工智能在科学中的部分应用散点背景气泡显示的是AI直接用于改进科学进展的核心方面;横线背景气泡显示的是AI帮助设计研究或将结果传达给同行及公众;网格背景气泡代表着科学收益,这些收益不直接来自AI,而主要来自为AI使用而搭建的软件与硬件基础设施;斜线背景气泡指的是科学中的AI前沿;白色背景气泡代表AI对AI的研究
过去的十年里,人工智能在科学领域最典型的应用是监督学习,即在已经用正确的答案进行标注的数据上训练(用自动算法优化)模型。数据可能是由人工仔细标注的,或者通过模拟预先标注的,AI可以将对象分类到某些预定义的类别,如从大型强子对撞机收集的大量粒子碰撞数据中识别希格斯玻色子。它还可以对物体的某些属性进行回归,比如从图像中预测粒子在探测器中记录的能量。
一旦人工智能从标注的数据中学习到模式,它就能对尚未知道正确答案的新数据进行预测。例如,在从标注图像中了解到不同的家庭垃圾产品的外观后,人工智能就可以为未进行人工标注的新产品正确地分配垃圾箱(可回收和不可回收)。
在“异常检测”中,AI的目标是识别与AI模型所习惯看到的不同类型的新物体。例如,很难有一份详尽的、标注了所有可能异常类型的脑部扫描图像列表。然而,异常检测模型只需要在训练中看到健康大脑的例子,之后就可以在新患者的图像中标记异常。这样的模型不需要已经标注的训练数据。
因为科学要求可解释性,一个只给出正确答案而不提供任何进一步解释的不透明的AI模型,其使用价值是有限的。例如,异常检测模型可以在医学图像中突出显示令人担忧的区域,从而引导医学从业人员对这些区域进行进一步的调查。
在基础物理学中,寻找现象的最简单描述是有价值的,通常以简洁、易于理解的公式的形式呈现。深度学习的强大之处在于它可以构建大型的统计模型,通常包括数百万的参数。这些模型本质上是难以解释的。
在某些情况下,物理学家找到了一种方法,既可以使用深度学习的强大功能,又可以保留可解释性。其中一种方法是借助图神经网络实现的,可以设计这些网络,使得模型的各个组成部分能够描述特定的物理属性,如两个天体之间的相互作用。
一旦网络从数据中学习了这些关系,符号回归就可以将网络学到的信息提炼成易于理解的公式。这是一种比深度学习弱的技巧,但它可以自动找到简单的公式来描述数据。最近,在Cranmer等(2020)的帮助下,符号回归用一个易于理解的公式描述了邻近宇宙结构的质量分布所导致的暗物质浓度。
在数学科学领域,对可解释性的需求可能更高。数学家希望能够说:“AI,请写出这个定理的完整证明,并记得展示你的每一步工作!”那该怎么做呢?学微积分的高中生都很清楚,对于解决问题来说,一个提示是多么有用。掌握课程中的所有积分技巧是不够的。对于给定的问题,有太多的技巧可以尝试。
要在微积分考试中取得好成绩,关键是要培养一种直觉,即要知道什么策略在什么样的情况下可能会奏效。这种直觉是通过练习来培养的,而对于人工智能来说,这种直觉是通过训练来形成的。研究人员已经开发出相应功能,用以提示在每种情况下最有可能奏效的策略。这种方法已经被用在数学定理证明的过程自动化中。人工智能提出一个证明策略,经典定理证明器去执行这种策略,人工智能和经典定理证明器一起完成数学定理证明任务。
强化学习是人工智能领域令人兴奋的一种应用方式。它最近因掌握了国际象棋、围棋和流行电子游戏的规则,然后战胜了最优秀的人类玩家而备受瞩目。强化学习非常擅长学习具备复杂程序的动作以达到预期目标。
例如,在纽结理论中,许多尚未解决的问题都围绕着两个纽结是否可以被视为等价,以及是否可以通过一系列特定的动作将其中一个转变为另一个。如果答案是肯定的,强化学习通常可以找到从第一个纽结到第二个的确切路径,从而提供清晰的等价证明(Gukov et al.,2020)。尽管这些完全可验证的解决方案很有趣,但它们通常仅限于数学科学领域。
当涉及信任科学成果的时候,无论是基于记录数据的测量结果还是基于简化假设的复杂模拟结果,科学家都非常关注不确定性。一段时间以来,许多科学家不愿使用人工智能,因为很难量化其结果的不确定性。然而,最近情况发生了变化,因为科学家们发现人工智能可以帮助更准确地量化不确定性。
AI能够追踪经过漫长科学流程积累的多种不确定性,而传统方法只能跟踪某些关于不确定性的概括性信息。AI甚至可以帮助减少这些不确定性,使科学家能够进行更有信心的测量。例如,粒子物理学家已经开发了不确定性感知网络。这些AI模型在训练时明确地展示了数据测量中的潜在偏差。模型可以自动找到处理每个潜在偏差的最佳方法(Ghosh et al.,2021)。
相同的技术允许天体物理学家从高维望远镜图像(分辨率非常高的原始图像,通常需要应用传统的统计技术进行汇总)跟踪不确定性。例如,可以一直追踪这些不确定性直至统计推断的最后一步,从而从X射线望远镜图像中推断出中子星内部物质的性质(Farrell et al.,2022)。
这一过程使得进行全面的最终测量成为可能,同时还能不遗漏中间步骤重要信息。这种端到端的模式越来越受欢迎。量化模型本身的不确定性有一个额外的好处:它可以使数据采集更加有效。例如,医学里有大量数据,但其中只有一小部分是有标注的(因为标注数据需要大量的人力)。人工智能可以帮助找出哪些样本是人类最需要标注的。
主动学习模型可以反复要求人们以一种方式标注数据点,以减少数据的整体不确定性。例如,对一幅图像进行标注可以让AI学习对类似的图像进行标注的通用模式。在这种情况下,要求对第一幅图像进行人工标注是有价值的,后续类似图像不再需要标注,模型就可以对它们进行准确的预测。
若一个AI系统对某种类型的数据更加不确定,则表明目前对这类数据记录的知识较少。因此,投入人力和时间来标记这些不确定的数据,将比花费相同的资源标记人工智能不确定性很小的数据增加更多记录的知识。在药物发现的一个实例中,采用类似方法将所需实验数量从传统算法所需的20%减少到2.5%(Kangas et al.,2014)。
科学过程有许多阶段—从假设产生、实验设计、监测和模拟一直到出版发表。到目前为止,本文只讨论了AI在得出科学研究最终结果中的应用。然而,人工智能有望在科学研究的各个阶段发挥作用。
例如,在药物发现中,当需要尝试许多可能的化学组合时,AI可以将它们缩小到最有前景的选项上。在理论物理学中,如果研究人员预感到两种数学工具可能具有某种相同的用处,AI可以帮助确定二者的相关性。这反过来又鼓励数学家投入时间去发现一个缜密的数学联系。科学的另一个关键要素是模拟,而深度学习在这方面产生了巨大的影响。
传统上,非结构化数据(如卫星图像、全球天气数据)的处理一直是一个挑战,因为需要开发专门的算法来处理它们。深度学习在处理这类数据以解决特定任务方面取得了惊人的效果。
它通过各种应用进入了流行文化。例如,一个模型使用了一个人的形象,展示这个人30年后的样子。另一个例子是,GitHub Copilot仅根据简单的英语描述代码需要做什么,就能为软件开发人员编写完整的代码块。
能够以深度学习的方式创建新数据的模型被称为“生成式”模型。在科学研究中,此类生成式网络被用来模拟物理系统。有时,它们可以在精度方面超过最先进的传统模拟算法。更常见的是,它们之所以有用,是因为它们消耗的计算资源较少。通过这种方式,它们可以解放科学家,使科学家们不再需要为每一个物理过程创建专门的模拟算法。
具有类似结构的生成式人工智能模型可以学习模拟宇宙的演化、某些生物过程等,使它们成为一种通用工具。在另一个案例中,生成式模型可以从数据中去除噪声或不需要的对象,例如,分离混叠的星系图像(un-blend images of galaxie)。
这类模型的一个十分令人兴奋的特点是它们能够提供“超分辨率”数据,即比原始记录数据具有更高分辨率的数据。例如,在材料科学领域,超分辨率模型可以正确地将成本较低的低分辨率电子显微镜图像增强为原本需要更高成本才能捕获的高分辨率图像(Qian et al.,2020)。诀窍在于让系统以高分辨率查看小区域,并将其与低分辨率下的相同区域进行比较,并学习差异。然后,该系统可以将低分辨率图像中的所有区域—整个视场—转换成高分辨率图像。在生物科学领域,这种方法除了节省资金外,还可以保护一些研究对象。例如,闪烁的高强度光有助于细胞结构成像,但也会损害标本,超分辨率技术可以避免这个问题。
好奇的读者可能会对这些人工智能模拟模型的能力感到惊讶。在给定一些初始条件的情况下,人们是否总能训练出一些模型来模拟未来的某个系统?经典力学表明,这对于混沌系统(chaotic system)来说会变得越来越困难。虽然人工智能并不能神奇地规避这一基本限制,但它可以改进以往的最佳实践。这正是人工智能在气候模拟(或任何其他混沌系统的模拟)中应用的魅力所在。生成式人工智能模型的简单应用可能无法准确预测长期天气模式。然而,Pathak等(2020)的研究表明,将人工智能与基础物理计算相结合的混合模拟引擎确实可以预测这种模式。
原则上,物理方程可以通过传统算法(由科学家设计的算法,而不是人工智能自动学习的算法)来计算,从而做出准确的预测。然而,从计算资源的角度看,以高分辨率运行这种算法的成本极高。低分辨率版本的算法更便宜,但不准确。然而,研究人员通过用人工智能强化低成本算法的预测,实现了对长时间天气的准确模拟。这种组合比高分辨率的传统算法运行成本低得多。这种技术的关键是使用低成本的求解器在短时间周期内递归地做出预测,用人工智能模型增强预测,然后在下一个短时间周期内进行重复。
将某科学领域的知识与人工智能系统整合是一个普遍的趋势,可以帮助对曾经认为的可能边界进行突破。在上述气候学的例子中,科学家们会将对气候系统如何运作的专业科学领域知识转化为数学模型和物理方程式,这些方程式能够描述和预测气候行为。随着人工智能技术的发展,这些领域知识也可以被集成到AI系统中,以增强其在气候建模方面的能力和准确性。未来几年,在天气和气候建模方面,人工智能将带来更多创新,尤其是考虑到气候变化的影响越来越大(如越来越不稳定和极端的天气模式)。
AI还可以用于数据压缩,即找到用更少属性来概括相同信息的方法。例如,考虑一个包含256×256像素圆圈图像的数据集。与其存储每个像素的值,不如只存储圆圈的位置和半径,仍然可以保留所有相关信息。这可以提高数据存储和传输的效率。
最近,人工智能也被用于将多维数据压缩为二维(数据被简化为两个属性),以便在屏幕或纸上进行可视化。数据的压缩表示本身可以揭示数据中难以检测的潜在模式。例如,压缩表示可能会显示某些数据点聚集成不同的数据集群,这通常表明每个数据集群具有一些统一的特征。如果科学家们能确定一个聚类的统一特征,他们也可能会注意到聚类中尚未发现该特征的新数据点。这可以帮助科学家找到具有所需特征的项目—从化学物质到材料再到数学群组。例如,这种研究方法在理论粒子物理学中引起了越来越大的兴趣,因为它可以帮助找到描述宇宙的新理论。
压缩也有助于产生资源效率更高的算法。AI可以通过自我优化的方式找到更小的模型,这些模型可以更轻松地部署在高速硬件上,用于大型强子对撞机等对速度要求极高的应用。
深度学习的出现也以间接的方式促进了科学的发展。它促进了自动执行微分计算的软件开发,这种软件被称为
。它还促进了对高级并行处理硬件[如图形处理器单元(GPU)]和更高效的数据存储技术的需求。这些发展使得科学家们能够
用自动微分算法取代旧的优化算法,优化复杂的传统算法,并利用并行编程的强大功能
。越来越雄心勃勃的努力也正在出现,即利用新的优化算法进行复杂的实验设计。使用开源的自动微分软件可以减轻科学家维护自己的软件或将它们升级到运行在GPU等现代硬件上的负担。
除了主要的研究阶段,人工智能在科学研究中还有更广泛的用途。在交流方面,一些人工智能模型已经被开发出来,用于总结研究论文,一些流行的Twitter机器人会定期在Twitter上发布这些自动生成的摘要。某些人工智能模型可以突出研究论文某些方面,使它更容易或更难理解(Huang,2018)。例如,模型偏爱早期包含概念图的文章,大概是为了帮助指导读者阅读。
最近,研究人员提出了一种基于人工智能的方法,以便更有效地向理论物理学家展示物理学实验结果(Arratia et al.,2022)。通常,有效利用大型实验(如欧洲核子研究中心的实验)的数据需要一支熟悉探测器的物理学家团队。将多个大型实验的结果结合起来需要一支专门的团队,包括每个实验的物理学家。每次需要测试新的理论时,这都不切实际。因此,大型物理实验合作机构会尝试以理论家易于重复使用的方式来展示它们的成果。传统的做法以忽略细节为代价对结果进行了总结。新提出的人工智能方法可以让不熟悉实验的理论家更容易地获取详细的结果,从而探索、组合和重复使用来自多个大型实验合作组织的测量结果,如先进地形激光测高系统(advanced topographic laser altimeter system)、内容管理系统、上底夸克探测器(Large Hadron Collider beauty,LHCb)(来自欧洲核子研究中心)、BelleⅡ(日本),甚至宇宙学观测。这将通过使信息更易于为更广泛的科学界所用,从而增强每个测量结果的影响力。
这些都是人工智能帮助更好地传播科学成果的例子,甚至是向相关领域的专家进行传播。未来,人工智能驱动的虚拟现实或增强现实有望帮助人们更直观地了解和探索从DNA的结构到大型强子对撞机粒子碰撞等科学概念。
尽管我们当前主要在电子数据的背景下探讨AI,但AI增强型实验室机器人的应用正在增长。实验室机器人可以帮助将需要重复的精确任务自动化,如处理试管和细胞培养等,避免人类接触有害的化学物质或辐射。此外,日益智能的实验室机器人在实验设计和分析中的作用也越来越大。许多人喜爱火星探测器“好奇号”。未来太空和海洋探索将看到众多基于AI的机器人应用。
到目前为止,本文的讨论一直是乐观的。然而,忽视人工智能驱动的研究工具的弱点以及盲目采用则存在潜在危险。
数据驱动的人工智能模型有时会以不同于传统算法的方式发生故障。例如,在使用深度学习的情况下,一个在实验室里用来处理红色、蓝色和绿色瓶子的机器人可能无法正确地识别黑色瓶子。因此,需要非常严格地验证人工智能模型在不同情况下的行为。目前正在进行一些工作,旨在开发可以完全验证的AI模型,并量化其最大失败风险。因此,要使这些模型在实际任务中发挥作用,还需要进行重大创新。
深度学习模型从训练数据中捕获潜在的规律,包括模拟中的任何偏差。这与在某些类型的历史人类数据上训练的模型能够学习到社会偏见(如性别歧视和针对少数族裔的歧视)类似。解决这个问题的一个常见方法是迫使模型的预测与受保护特征(如种族、性别和年龄)去相关。然而,这种去相关(de-correlation)的尝试实际上可能会导致进一步的意外伤害,特别是在不容易列出所有潜在偏差来源的情况下。
有时候,用科学数据而不是人类数据来展示这些偏见缓解技术的意想不到后果会更容易。例如,Ghosh和Nachman(2022)表明在粒子物理学的背景下,去相关技术有时会隐藏偏差,而不是消除它们。在某些情况下,真正的偏差很难或不可能测量,所以物理学家使用代理指标来估计它。例如,当某种理论的确切数学计算无法完成时,他们可能会使用已知的最佳近似技术。为了估计这种技术的潜在偏差,他们还使用一系列替代技术计算近似值,并将结果之间的差异视为不确定性的估计。
在Ghosh和Nachman(2022)所做的这项物理学研究中,在应用了一种可使偏差替代指标最小化的去除偏差方案后,发现模型中的真实偏差甚至更大。这导致最终测量结果的不确定性被大大低估。因此,在试图消除人工智能模型中的偏差之前,最好考虑这种意外后果的可能性。
更普遍地来说,如果同一个指标已经被用于优化该模型,那么用它来评估该模型的表现是否合理,也应该仔细考虑。另外,有时我们更需要政策解决方案,而不是技术解决方案。例如,理论上,AI模型可以尝试预测哪些学生更有可能在科学、技术、工程和数学研究生涯中获得成功。但是,数据可能受到现有社会偏见的影响。更有效的成功解决方案可能在于改善资源材料的获取、导师指导以及创造内容的工作环境等方面的政策。
AI模型只是学习数据中的相关性,而不是其中的因果关系。需要使用因果模型来区分相关性和因果关系。例如,如果一项研究指出,一个人群中的维生素D水平与抑郁症相关,那么这是否意味着二者为因果关系,或者它们都只是某个(未知的)潜在问题的症状?
认知科学领域的一项有趣的研究着重于人类与人工智能之间的互动,这展示了人工智能如何有助于揭示因果关系的一种方式。研究人员意识到,他们可以使用AI生成在现实生活中难以创造的情境,然后研究其在现实世界的影响。例如,英国的孩子与由人工智能驱动的虚拟教师互动,这位教师先以工人阶级的英国口音讲话,然后以真实教师的不同口音讲话。这使得研究人员能够研究教师口音对不同背景儿童学习的影响。研究这些替代情境的能力有助于建立因果关系。
人们对将概率编程(interfacing probabilistic programming,一种算法,用于计算科学中某些过程的概率性质)与科学模拟器(scientific simulator,如粒子物理模拟器)结合起来以推断因果关系的兴趣也越来越浓厚。这些程序可以运行多种可能解释某些观察到的数据的场景。AI与因果推理的交叉领域是一个新兴领域,最近已成为一个热门研究课题。这一领域的进展将有助于加速科学进步。
目前的趋势是开发耗费大量计算资源的大型AI模型。这可能会给预算较小的研究团队带来问题,特别是与大型AI公司相比。这些模型还会留下大量碳足迹,对环境有害。
需要创新来提升AI模型的资源利用效率。除此之外,政府可能还必须投资于可在全国范围内由研究小组共享的计算资源。美国已经成立了一个特别工作组,来研究国家人工智能研究资源的可行性(NAIRR,2022)。
人工智能加速科学发展的方式正在迅速发展。在某些情况下,人工智能使科学取得的巨大飞跃引起了公众的关注。例如,AlphaFold模型(一种深度学习解决方案)通过展示从氨基酸序列预测三维蛋白质结构的非凡能力而成为头条新闻。然而,AI对科学的潜在影响还远未实现。
在当前“人工智能过剩”的情况下,很多创新都有潜力,但还没有足够的时间去探索它们。在过去的十年里,我们见证了许多概念验证创新,但在下一个十年,将人工智能纳入大型科学工作流程将变得非常普遍。在某些情况下,如在大型强子对撞机上,已经建立了自动化工作流程(Simko et al.,2021)。未来可能会看到科学工作的流程使用人工智能进行端到端的优化—从数据收集到最终统计分析。在某些情况下,整个科学过程—从假设的产生到科学结果的交流—也可以完全自动化。
用于科学研究的人工智能创新往往很容易在不同的科学领域之间进行转移,这导致了跨越不同学科的统一方法的出现。在基于模拟的推断中,科学推断依赖于使用精确的模拟器来优化某些测量结果。可微编程使用自动进行微积分计算的软件来优化科学工作流程。这些以及其他诸如异常检测和生成式模型等统一方法重新激发了对跨学科专家的需求。
虽然典型的机器学习模型很难解释,但它对于假设生成、实验监控和精确测量等任务仍然有用。更具解释性的模型对于构建数学证明很有用。生成式模型有助于完成模拟、从数据中删除不需要的特征和提供超分辨率数据等任务。不确定性感知和不确定性量化模型在提供可信、可靠的结果方面非常有用。这些模型还可以通过优化在不确定区域采集数据来帮助高效地采集数据。
滥用人工智能会带来危险,因为这些模型可能会以意想不到的方式失效。因此,AI专家有必要成为人工智能应用的积极倡导者,同时也要警惕不当应用的不良后果。模型提供更多算法限制,以避免灾难性的故障。例如,控制科学机器的人工智能系统在遇到它在训练中从未经历过的情况时表现异常,就可能发生这种情况。科学的特定需求推动了有趣的人工智能创新,其中一些已经在科学之外找到了用途。与为科学开发的其他技术一样,我们有理由期待人工智能领域越来越多的科学创新最终将以更广泛的方式造福人类。
未来可能会在实验室和其他领域越来越多地使用人工智能驱动的机器人,如收集空间和海洋的科学数据。开发因果推理模型的创新将为医学和社会科学带来巨大的益处。通过加速科学进步,人工智能领域的创新预计将有助于找到解决全球挑战的方案,如清洁能源的产生和储存、改进的气候模型和疾病的治疗。