尽管近年来人工智能(AI)取得了长足的发展,但《主算法》的作者Pedro Domingos认为,要想实现AI的重大突破,我们还缺少了一些重大的思想。那这位曾经的纽约大学哲学教授、一直观察着自己现在2岁的孩子学习过程的创业者能不能让AI更像人一点呢?
跟任何一位自豪的父亲一样,Gary Marcus总是很乐意说说他那2岁的儿子取得的最新成就。所不同的是,他认为自己小孩学习推理的方式可能也是让机器变得更智能的关键。
45岁的Gary Marcus 1年前的另一个身份是纽约大学哲学教授,现在则是一家名为Geometric Intelligence的新初创企业的创始人。在车后座上,他的儿子看到一个指示牌写着11,因为之前他知道其它类似的两位数叫“thirty-three(33)”或“seventy-seven(77)”,他就问他爸爸那个数字是不是“onety-one”。
“他推测把数字放到一起是不是有个规则,” Marcus笑着解释:“这个概括有点泛化了,他犯了个错误,但这是非常复杂的错误。”
Marcus跟现在许多站在人工智能研究前沿的计算机科学家和数学家的观点很不一样。他已经研究了几十年人类思维以及儿童学习语言乐感等新技能的方式。这让他相信,如果研究人员想要创造真正复杂的人工智能(能容易地了解世界的那种),就必须从幼童学习新概念和归纳的方法中寻找线索。而这也是他成立新公司的一大灵感。通过这种激进的机器学习法,Geometric Intelligence希望能创造出新的更懂学习的AI算法。
试图把AI商用化的其他公司,从Google到百度,都把算法聚焦在大脑神经元和突触接触到新的信息和体验时发生变化的粗略模型上。这种所谓的深度学习方法近年来取得了一些令人震惊的成果,尤其是随着数据的增多和硬件的提升,使得基础计算能力有了规模提升。在识别人脸或语音方面,深度学习已经赶上甚至超越了人类。Google、Facebook等大公司把这种方法运用到了各种大规模数据上,试图从中识别出模式,执行搜索结果优化、教计算机进行会话等任务。
但深度学习所基于的大脑模型是不是简单过头了呢?Geometric Intelligence,确切地说,Marcus本人断言,由于忽略了人类思维方式的众多微妙之处,计算机科学家错失了一个巨大的机会。他在各种场合猛烈抨击了对深度学习的狂热。尽管言语间偶尔有些伤人,但的确提供了一种有价值的相反观点。这些系统需要提供许多样本才能学会一些东西是他抨击的要点之一。那些试图让机器能够进行自然对话的研究者的做法是,给系统提供无数之前对话的脚本。胜任一些简单对话也许没有问题,但认知科学认为人类学习语言的方式不是这样的。
与之形成对比的是,2岁的幼童通过外推和归纳进行学习的能力,虽不算完美,但却要复杂得多。显然大脑能做的不仅仅是在大规模数据中识别出模式:而是从相对少量的数据中获得更深度的抽象。如果能让机器学会这种抽象,哪怕是基本的抽象,也会成为一项重大的成就。无人车可能就不需要行驶数百万公里才能学会如何应对新的路况。只给看过一两次机器人就能认出并去拿一瓶药。换言之,这些机器的思维和行为方式会更像人一点。
头发有点蓬乱,胡子好几天没刮的Marcus看起来已经适应了作为创业者的新角色。极具幽默感和恶作剧精神的他兴奋地解释着人脑的工作机制,但是却拒绝透露自己的公司在开发什么产品和应用,因为担心像Google这样的公司会因为掌握了关键内幕而获得优势。不符哦他说公司已经开发出了一种算法,这种算法能够通过相对少量的数据学习就能够学习,甚至能够以比较粗糙的方式利用提供的信息进行外推和归纳。Marcus说他的团队已经在深度学习胜任的任务中测试了这些算法,并证明了这些算法在若干情况下要表现得出色许多。“我们知道一些大脑应该具备的属性,”他解释说:“从某种意义来说,我们在尝试对那些属性进行逆向工程。”
出生在巴尔的摩的Marcus高中时读了《The Mind’s I》(《心我论》,认知科学家Douglas Hofstadter与哲学家Daniel Dennett的论文集)和《Gödel, Escher, Bach》(《哥德尔、艾舍尔、巴赫》,Hofstadter关于思想与机器关系隐喻的一部书)之后就开始被思维迷住了。也大概在那个时候,他写了一个把拉丁文翻译为英文的程序。这项任务的难度让他意识到,给机器再造智能肯定要对人类思维内部的现象拥有很深入的理解才行。
Marcus拉丁文转英文的程序不是很实用,但这使得Hampshire College让他提前几年拿到了学士学位。Amherst市的一些奉行自由教育的小学校鼓励学生自己设计学位课程。于是Marcus决定投身于破解人类认知的谜题。
1980年代中期是AI领域的一段有趣的时光。该领域被分成了泾渭分明的两个阵营,一派试图通过复制大脑的基础生物特质来制造智能机器,另一派则试图用传统计算机和软件去模仿更高级的认知功能。AI的早期工作是以后者为基础的,采用了处理逻辑和符号表征的编程语言(如Prolog)。鸟就是个典型例子。鸟会飞这一事实可以编码为知识的一部分。然后如果计算机被告知掠鸟是鸟,它就会推断掠鸟能飞。后来推出过几个大项目,旨在把人类的知识编码成浩大的数据库,希望最终能够诞生某种复杂的智能。
不过尽管取得了一些进展,结果表明,这种办法变得越来越复杂和笨拙。规则总有例外,并不是所有鸟都会飞。而那些不能飞的原因也各不相同,比方说企鹅、笼中鸟与折翼之鸟就是这样。要想把所有的规则例外都编码进去被证明几乎是不可能的。人掌握这些例外情况似乎很快,但计算机不行。(当然也有例外,比如人也很容易把“onety-one”而不是“eleven”当成是11的英文)
未完待续......
————————
【招聘】36 氪招聘全职编译编辑,工作内容涉及翻译国外互联网科技、创投类文章;对国外科技动态进行原创报道;管理兼职译者团队。要求中英文功底扎实,对科技行业有了解、有热情,具有一定翻译基础和经验,工作责任心强,沟通协调能力强。简历及网络科技类翻译作品请发送至 lixue@36kr.com