尽管近年来人工智能(AI)取得了长足的发展,但《主算法》的作者Pedro Domingos认为,要想实现AI的重大突破,我们还缺少了一些重大的思想。那这位曾经的纽约大学哲学教授、一直观察着自己现在2岁的孩子学习过程的创业者能不能让AI更像人一点呢?
在Marcus准备进入Hampshire College的时候,一群心理学家想出了一个办法扬言要颠覆人工智能。还是1940年代的时候,Donald Hebb提出了一个理论解释大脑神经是如何学习输入的。他展示了神经元的重复放电可以强化相互间的连接,从而增加了在遇到相同输入时一起放电的可能性。一些研究人员利用类似设计开发了计算机。但这些所谓的神经网络的能力一直有限,直到1986年,一群研究人员找到了提高它们学习能力的办法。这些研究人员还展示了神经网络如何可以用来做各种事情,比如可视化数据的模式识别,或者学习英语动词的一般过去时等。只要用足够多的例子来训练这些网络,它们就能建立执行此类任务所需的连接。
研究人员把这种办法叫做“联结主义”,他们提出,这样的神经网络只要足够大就能够再造智能。尽管他们的想法并未马上被接受,但最终仍导致进入了今天的深度学习时代。
在联结主义起势的时候,Marcus也决定好了自己的硕士研究方向,他去听了著名认知科学家Steven Pinker的课,然后又是另一位MIT教授的。Pinker指出,儿童学习使用动词的方式跟联结主义是相反的,他们似乎并不纯粹通过记忆例子和归纳类似情况来学习动词的过去时。Pinker展示的证据表明,儿童很快就能够察觉语言的规则然后进行归纳。他和其他一些人认为,人类大脑的神经网络基本上已经进化出能提供更加复杂智能的必要工具。
19岁的时候Marcus加入了Pinker的MIT实验室,Pinker记忆中他是一个少年老成的学生。“我给他布置了一个项目,让他根据3个小孩的语音录音的小规模数据集分析简单的是否假设,”他在电子邮件中说:“几天后他已经对25位小孩的语音进行了详尽分析,其中测试了5、6个假设,这成为了一篇重大研究论文的基础。”
作为研究生的Marcus收集了更深入的证据去支持Pinker有关学习的想法,并且还加入了他自己的剖析。他开辟了大规模认知研究数据的计算机化分析,研究了成千上万的儿童语音录音来寻找儿童犯错(如“breaked”、“goed”等错误过去时)的例子。这些例子似乎证实了儿童掌握语法规则后应用到了新的单词上,而规则的例外情况则是靠死记硬背。
在这样研究的基础上,Marcus开始质疑联结主义有关智能可以从更大的神经网络诞生的信念,并把关注点集中在深度学习的限制和扭曲上。深度学习系统经过训练能够认识图像或视频中的特定鸟类,并能够分辨能飞和不能飞的鸟之间的区别。但这需要看过数百万的图像才能做到,并且不知道为什么鸟不能飞。
事实上,Marcus对儿童的研究让他得出了一个重要结论。2001年,他在《The Algebraic Mind》中指出,发育中的人类大脑既通过例子也通过所学的东西产生的规则去学习。换句话说,大脑利用某种像深度学习系统的机制去执行特定任务,但也会存储和操纵有关世界运作方式的规则,以便能够从少数经验中得出有用的结论。
这并不是说Geometric Intelligence试图去模仿大脑的机制。“在理想世界中,我们是能够知道孩子怎么做到的,”Marcus说:“我们会知道牵涉到那些大脑回路,进行了哪些计算。但其神经科学仍旧是个迷。”他暗示自己的公司采用了许多技术,包括一项“兼容”深度学习的技术,试图再造人类的学习。
Geometric Intelligence的工作肯定是重大的,因为对于人工智能的未来而言,从认知科学和神经科学那里吸收新想法无疑是重要的。虽如此,但在跟Marcus见面之后,我仍有点像幼童试图弄清楚不熟悉的数字的感觉。这些东西要怎么拼凑到一起?我需要Marcus的一位协作者给我演示一下他们做的东西才能解开谜底。
Zoubin Ghahramani,英国剑桥大学信息工程教授,是Geometric Intelligence的联合创始人之一。Ghahramani在前苏联和伊朗长大,然后到了西班牙和美国,虽然他年级跟Marcus一样大,但到MIT比后者晚了一年。不过两人由于生日相同而最终结缘。
Ghahramani关注的是利用概率让机器变得更聪明。其背后的数学很复杂,但理由很简单:概率提供了一种办法去应对不确定和不完整的信息。我们可以再次用不能飞的鸟来说明这一点。一套基于概率的系统能够赋予鸟会飞这个概念以极高的可能性。然后,在知道鸵鸟是鸟之后,它会假设鸵鸟很有可能是会飞的。但其他的信息,比方说成年鸵鸟通常重达200磅以上,则有可能推翻这一假设,把鸵鸟会飞的概率降低到接近0。这种灵活的机制能够给机器灌输某种类似常识的粗略形式的东西,而常识这种特质对于人类智能至关重要。
Ghahramani给出了他和Marcus都关注一个特别应用:训练机器人处理复杂环境。在机器人学的研究里面,“拥有经验是要付出代价的,”他说:“你想让机器人学会走路,或者让无人车学会开车,那可不是给它提供有数百万跌倒、碰壁或出事故的例子的数据集就行,这根本就行不通。”
鉴于Geometric Intelligence的工作用到的概率算法等技术将兼容深度学习,Google、Facebook之流最终可能会收购这家公司并把它纳入自己的AI资产里面。而尽管Marcus批评联结主义和的深度学习热,对于这样的结果,我怀疑他也是相当满意的。
即便发生了这样的事情,如果Marcus能够证明我们已知的、最不可思议的学习系统—人脑—是未来人工智能的关键,其意义也是重大的。Marcus告诉了他儿子聪明的有一个例子。“我妻子问他,‘你的动物朋友谁今天会去上学啊?’”Marcus说:“他回答,‘兔子,因为小熊和鸭嘴兽正在吃东西。’然后我妻子回到他的屋子,果然,那两个玩具正坐在椅子上‘吃东西。’”