1月14日,未来论坛2017年会暨首届未来科学颁奖典礼在北京国贸大酒店拉开帷幕。活动现场,百余名跨界意见领袖齐聚北京,为大家带来了一场史无前例的思想盛宴。在此次论坛上,微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长洪小文主持了以“未来智能”为主题的对话环节,四位人工智能领域的泰斗,与现场观众共同畅谈人工智能的未来,他们分别是:
六十年前初识计算机的时候,人们就在想:是否有一天我们可以创造出一种机器,达到甚至超越我们人类的智能水平。
几十年过去了,AI 经过了几个寒冬。我们仍然没有了却几十年前的心愿。今天,人工智能再一次火爆全球,我们似乎看到了人类科学正在加速冲向那个奇点。产业界和学术界都在不遗余力地进行 AI 研究,甚至流行的美剧也在讨论人工智能。
站在今天的节点上,人工智能到底有什么突破,未来的人工智能会向什么方向前进呢?本文由“未来智能”的对话环节内容整理而成,希望大家能在这次难得的华人人工智能领域大牛齐聚的对话中得到启发。
洪小文:我们知道,人工智能这个概念从诞生至今已有六十年历史,它也经历了几次所谓的“人工智能的寒冬”。这一次,人工智能的重新回暖有什么不同?技术上又有哪些新突破?短时间内,我们能制造出像人类智能一样的人工智能吗?我们应该担心未来人类有可能不再占据智能的制高点吗?请各位简要分享下自己对人工智能的理解。
大家都说人工智能可以做很多事情,我想先说说人工智能目前还不能做什么。
人工智能学科从创立到现在,只往前走了两步。
第一步,是符号表示和推理模型。
以前人工智能只是建立在数学模型的基础上。而符号表示和推理模型在数学模型的基础上,把问题变成:如果可以把这个问题清晰地用陈述性或过程性的语言表述出来,那么计算机就能解决它。
当这个模型被提出来,人工智能解决问题的能力就显然提高了一大步。因为能够表述清楚的问题远多于能够用数学所表达的问题。
实际上,当时对人工智能的估计过高。因为人们发现,能“清楚表达”的问题很少。即使是理性思考,有很多问题都不能表述。例如,常识等等。因此,人工智能就这样遇到了挫折。
第二步,就是深度学习为代表的数据驱动的方法。
这又让人工智能向前迈了一步,而且这一步比前一步大得多。
也就是说,过去智能对于能够清楚表述的问题——“知其然,又知其所以然”的问题才可以用计算机解决。而现在,我们也可以解决“知其然,而不知其所以然”的问题。特别是可以解决感知、视觉、图像、听觉等方面的问题,例如:张三长什么样子,这个实在是不好表述。所有感知都是所谓“知其然,不知其所以然”的问题。那么,“知其然,不知所以然”的问题怎么做呢?就是通过数据学习,通过数据自然建立起来模型,来解决它。那么,这就把能够解决问题的范围扩大了很多。
我们身边充满“说不清道不明”的问题,用新的深度学习技术可以解决很多这类问题。但是,我们的人工智能还没有到顶峰。
目前的人工智能有三个限制条件。
1、必须是确定性的
2、必须是完全的知识和信息
3、只能解决封闭化、特定化的问题
一个典型的人工智能可以解决的问题就是:AlphaGo下围棋,大家都觉得它很了不起。但是围棋是符合这三个条件的。围棋有着确定的规则和目标;有着完全的信息——对方如何下子,盘面的信息,没有任何不确定性;而它是限定范围的、封闭的问题。
处理带有这三个限制条件的问题,计算机肯定比人类好。但是如果缺一个条件,计算机就非常难完成了。例如打桥牌,答案不是封闭的,计算机就很难做了。
深度学习目前有两个很难克服的重要缺点:
1、不像人类,机器学习过的内容、和没学习过的内容,在识别效果方面差距太大。例如一个模式识别系统,经过训练可以很好地识别马、牛、羊。你突然给它一块石头,它还是认为这块石头可能是马、或者牛。
2、机器数据输入和输出结果差距太大。人类智能是举一反三,而机器是举一百反一。给几百万的数据,才能识别几万个目标。
所以,现在的人工智能还有很长的路要走。
我接着张老师的话说。很多朋友都知道我刚刚生了我们家的老二,还不到一岁大。
作为人工智能研究者,我很高兴能体会当妈妈的感觉,我也在感受她的成长。刚刚张钹老师说感知代表了很多“不知其所以然”的问题,所以,现在通过海量的数据,尤其大规模数据标注的情况下,深度学习有了一些突破。
我觉得人工智能的下一步应该是认知。
认知其实包括很多我们还不太清楚怎么用数学和人工智能表达的内容,比如:知识系统的建立、情感的产生和交流、好奇心和创造力驱动的学习,还有 learning to learn。这些都是认知的范畴。
确实,我们人工智能又迎来了春天,但下面确实还有很长的路要走。
我认为下一步人工智能的发展,需要加强对情感、情绪的了解,要走进认知学、心理学。我说的不仅是脑科学,而是认知科学。因为我们目前对人的情感理解非常少,而这对于人工智能来说是很重要的。
作为人工智能学者,能够得到这么多关注,我很高兴。但是我也担心这样的“泡沫”会带来什么。如果是更多的机会和研发投入,当然是好事;如果是过度承诺或者不切实际的产品研究工作,可能会对这个领域有些不好的影响。
我参加过很多论坛,大家都在问:人工智能什么时候能超过人?一般专家都会推断通用人工智能超过人的时间,一定在他去世之后的某个时点,例如:五十年后。到了要验证正确与否的时候,他已经不在了,也就不会有人追究他了。(笑)
我认为,当人们提出这个问题的时候,有一个假设条件,那就是:假定人类自身的智能不再往前走了。
但是,实际上人类智能还是往前发展的。尤其是现在我们对人的大脑有了新的了解,就可以很快帮助我们提高自己的智能。而人类对大脑的了解,也可以帮助提高研究人工智能的水平。
深度学习,实际上是把我们对人脑神经网络非常简单的理解变成算法。然后加之以数据,发现效果很好。但是,这些人脑神经的知识都是三四十年以前的知识。而我们在期待脑科学有新的突破,这些新的知识一定可以推动人工智能向前迈进一大步。所以说,智能这条路是很长很长的。我同意前面李飞飞跟张老讲的,我们应该相信人类智能往前走也是无止境的,而不仅仅只是人工智能会发展。
我在工业界工作,所以我对人工智能的发展还是持非常乐观的态度的。
虽然张钹老师讲深度学习存在种种问题,但是因为今天有大量的数据,有非常强大的运算,加上现在有很多先进的算法,能看到非常多的应用方向。我相信,比如像语音识别这件事情五年之内计算机一定会比人做的好。我自己做计算机视觉研究的,我觉得视觉识别,十年之内计算机会比人做的好。大家可以设想一下,十年以后这些技术会带来一些什么样的商业机会。
另一方面,对工业界来说,今天所有的商业应用都可能会被颠覆。从销售市场,到人事招聘,到用户服务,所有的商业环节都被人工智能改变了,所以从商业角度来看,我看到的是更多的机会。
洪小文:这次人工智能的复兴,要感谢深度学习和大数据。那么,深度学习到底是什么,未来可以看到它怎样的发展?为了人工智能的终极目标,除了深度学习以外,我们还需要研究哪些其他的方向?
五十年后的事情可能我说不清楚,但是我可以说说三五年,十年以内的事情。很多人说究竟现在是人工智能的春天还是夏天?有人说春天,因为正在蓬勃发展。有人说夏天,因为有点热过头了。
但是我的观点是现在是人工智能的秋天。秋天有两个含义。
一:秋天是收获的季节,我们有很多成果。
人工智能现在有果实可摘。为什么我觉得很乐观?所谓的深度学习就是在消费这三件东西,而人工智能需要的这三个资源可以说都是无限的。
1、大数据
2、算法
3、计算力
未来相当一部分人都会往这三个方向去发展,会在各个领域去消费它,包括语音、图像等方面取得很好的成果。
二、说秋天,是因为冬天就在前头。
做科学研究,我们要知道冬天要来了。这意味着我们要考虑下一个春天要播种什么种子。也就是说,后深度学习时代,我们要搞什么事。我认为从科学研究的角度来讲,我不能讲全,我就讲在我们的研究组里头在做的两件事。
第一点是与神经科学、脑科学结合发展新的计算模型。
深度学习只学习了人类大脑神经网络处理非常简单的一个内容,就是多层次的、从底向上的处理。但是人脑有很多层次,其中还有大量内容我们并不了解,比如有从顶向下、侧向连接等等模式,我们都还不了解。
目前为止驱动人工智能就有两招:数据驱动和知识驱动。下面的发展就要把这两招结合起来。特别是自然语言处理,离不开知识驱动,只靠数据是不够的。
第二点是将知识驱动和数据驱动相结合。
现在为止驱动人工智能就有两招:数据驱动和知识驱动。下面的发展就要把两招结合起来。特别是自然语言处理,离不开知识驱动,只靠数据是不够的。
所以说,如果以上这两点能做好,人工智能就会迎来下一个春天。
稍微具体一点说到深度学习。什么叫“深度学习”?“深度学习”大概在2006年被Geoffrey Hinton的一篇论文提出来,但是在2006年之前,“神经网络”这个概念已经存在了二三十年。
现在大部分成功的深度学习是有监督学习、有完全的数据标注以后做的。很多人都在思考如何做无监督的学习,之前也有很多工具。深度学习革命性的一点是取代了对特征的加工。此前都是“Engineering Feature”,而深度学习是直接学习数据。
深度学习不操作数据本身,而是对结构本身进行操作。很多学生就感觉,深度学习本身结构太复杂了,例如现在有152层、1001层。所以这一点有巨大的空间,就是我们可以怎么去学习这个模型,可以突破结构的层面。
我认同张钹老师说的,数据和知识的结合。另外我还会再加上一个情感。现在我们的 AI 都是用逻辑的方法来判断情感。因为逻辑代表 IQ,而情感代表 EQ。我觉得微软的小冰是一个非常好的开始。人类的情感是非常丰富的。未来,从情绪到情感,将是人工智能未来前进的方向。
任何工作都有近期和远期。近期人工智能的发展,我很认同李飞飞讲的,和深度学习有关。机器学习和以前的专家系统有一个非常不同的地方。专家系统是用软件把人的知识写到系统里。机器学习输入的是算法 知识,输出的是程序,用这个程序来做你要做的应用。
大多数人在算法上做,而我和李飞飞则觉得应该发展知识。知识就相当于上学时候的教科书。总要有人写教科书。如果没有人写教科书的话,学习方法再好,老师再好,你学的是一年级的教科书,也永远不可能成为博士。所以我觉得很多领域都需要有人写教科书。
这个领域里有些人的目标不是产生巨大的贡献和影响力。有人想要的是写很多文章,这样可以拿到很多资金。有做算法的研究室通过发表文章,也可能拿到很多科研基金。而我和李飞飞的合作项目做的时候没有资金——申请的时候被拒绝了。
我们申请两次都被拒绝了。也就是说,做很多有颠覆性的事情是很多人不认同的,但是我觉得近期内人工智能要想发展,必须得有足够的人来做这些知识的积累和总结,也就是写这些教科书。
长远来看,我认同两位的意见,对人的大脑,人的智力是怎么工作的,要有更多的了解。这样才会帮助整个 AI 向前走。
我很赞同张老师说的,现在是人工智能的秋天。从工业界来看,人工智能技术可以应用到很多商业的应用上,毫无疑问,接下来三到五年,会看到越来越多人工智能技术帮助人们解决很多的问题。但是秋天过了,冬天我们要做什么呢?
可以做的东西其实有很多,但是我想和大家分享两点。
第一点,我和张老师稍微有一点不同的地方,张老师觉得数据、算法和计算资源是永远取之不尽的。我觉得数据很多、算法互通,确实是取之不尽的。但是在计算能力这件事上,我们应该更加重视。几十年下来的摩尔定律,让我们把人工智能做到了今天,这是非常了不起的飞速增长的五十年。但是工业界基本同意,计算能力会慢慢降下来。这也是大家为什么都在非常认真地去做量子计算的问题。我个人的看法是,量子计算可能还要十年、十五年才能看到突破。今天我们 AI 向前走必须要考虑的问题是:计算能力的瓶颈。
第二点,我们要考虑为什么做AI。是不是计算能力的增强,就一定会产生智能。从人脑的结构来看,我们应该定一个小目标:希望在脑科学和人工智能的结合上,解决几个了不起的问题。我自己想要解决三个和人脑息息相关的疾病:儿童自闭症、中年忧郁症、老年痴呆症。
人工智能如果能解决这三个问题,将会是相当了不起的成就。
我对沈向洋说的,有关计算能力的方面想做一下补充。
同样的一个题目,在我们脑袋里解决一点不费劲,为什么在计算机里面就要这么多的计算资源来处理?我们要思考的是这个问题,而不是拼命加快计算机。
我觉得,正是因为我们过去走的这条路,迫使我们必须加快计算力。我的观点是,我们过去做的计算机,从空间结构来讲是最简单的冯·诺依曼结构。而大脑的空间结构是最复杂的,是一个网络。你想用一个空间结构最简单的东西去做空间结构复杂的工作,它花去的代价就是计算时间的增加。世界上没有免费的午餐。
过去我们使用大量的计算时间来换取同样的结果,现在能不能改变思路,把计算机做一下改变?例如 IBM 公司正在做的,让神经网络的复杂度提高,换来能耗和时间的降低。
因此我们的研究还是得立足于计算机的现状上进行改进。这是我的补充。