6.24 智能、知识和学习
人工智能,为什么会在之前的几十年中遇到了很多阻碍?原因是,我们对世界的绝大部分认知,都并不会通过书面语言清清楚楚地、像一系列任务一样描述出来——而这恰恰是编写计算机程序所必需的步骤。这就是为什么我们还无法直接让计算机完成很多人类可以轻而易举完成的事情——不论是理解演讲、图像、语言还是驾驶汽车。而类似的尝试——在详尽数据库中组织事实集,为计算机注 入 智 能(organizing sets of facts in elaboratedatabases to imbue computers with a facsimile ofintelligence)——也都不太成功。
那正好是深度学习的用武之地。它是更广泛的人工智能领域(亦即机器学习)的一部分。它的基础是用来训练智能计算系统的基本原则,目标是让机器实现自学。这些基本原则之一与人类或机器所认为的“好”相关。对动物而言,进化论原则决定了它们应该做出优化生存、繁衍机会的决定。对人类社会来说,一个好的决定可能包括一些能够带来某种幸福表现的社会活动。而对于机器来说,比如无人驾驶汽车,决策的质量取决于自助车辆模仿人类司机行为的程度。
在特定语境中,是否能将作一个好决定所需要的知识翻译成计算机代码,并不一定显而易见。例如,一只老鼠了解它所在的环境,也本能知道往哪里嗅,如何移动它的腿,寻找食物或者配偶,躲避捕食者。没有程序员能详细描述这套行动指令的每一步,进而生成这些行为。但是,这些知识的确被编码进了这些啮齿类动物的大脑中。
在创建出可以训练自己的计算机之前,计算机科学家需要回答人类如何获取知识等基本问题。有些知识是天生的,但大多数是从经验中习得的。我们的知识本来就无法转化为计算机执行的一系列清晰步骤,但是,可以时常从样本和实践中习得。上世纪 50 年代依赖,研究人员已经在寻找并试着重新定义一些基本原则,这些基本原则允许动物或人——甚至机器——通过经验获取知识。机器学习旨在建立起学习步骤,也就是所谓的学习算法,它能让一台机器从给定的样本中学习。
图片来源 :Scientific American;机器之心汉化机器学习科学,在很大程度上是实验性的,因为不存在通用学习算法——没有能够让计算机学好每项给定任务的算法。任何知识获取的算法,都需要根据针对手头情况的数据和学习任务加以测试,是否能够识别日落,或者将英语翻译成乌尔都语。我们无法证明,在任何给定情况下,这个算法都始终、全面优于任何其他算法。
对于这个原则,人工智能研究人员已经有了正式的数学描述——“没有免费午餐”定理——定理证实,不存在能够解决每一个真实世界学习情境(learning situation)的算法。然而,人类行为显然与这一定理相悖。我们的大脑看起来具有相当的学习能力,能够让我们精通大量祖先无法掌握的技能(因为演化):下棋、架桥或者做人工智能研究。
这些能力表明,人类智能充分利用了关于世界的一般假设,这种假设可以被用作打造一种通用智能机器的灵感之源。正是出于这一原因,人工神经网络的开发者们已经将大脑作为设计智能系统的粗略模型。
大脑的主要计算单位是神经元细胞。每个神经元通过微小的细胞间隙 ( 轴突之间的突触间隙)向其他神经元发出信号。一个神经元倾向发出一个可以跨越间隙的信号的特性——以及那个信号的幅度——被称为一个突触强度(synapticstrength)。神经元一边“学习”,它的突触强度也在一边变大,因此,当受到电子脉冲刺激时,更容易向沿路相邻神经元发出信息。
脑科学对使用软件或硬件打造虚拟神经元的人工神经网络的兴起,产生了影响。人工智能子领域中的早期研究人员,以联结主义(connectionism)著称,认为这是理所当然的:通过逐渐改变神经元之间的链接以便神经活动模式可以捕捉到输入内容(比如一张图像或者一段对话),神经网络就能学会完成复杂任务。当这些网络接收到更加复杂的实例时,通过改变连接神经元之间的突触强度,学习过程就能继续下去,并最终更加准确地表征出内容,比如,日落的图像。