作者其他文章
【CIPF】赵东岩:人工智能及其影响
导读:2019年2月23日,由强国知识产权论坛组委会和北京强国知识产权研究院主办“洞察趋势•照进未来——2019强国知识产权论坛新春分享会暨服务业颁奖典礼”在北京大学博雅国际酒店中华厅成功举行。科学技术是中长期发展的关键变量,也是知识产权制度的所要面对的重要问题。论坛组委会特邀北京大学计算机科学技术研究所研究员,博士生导师,著名AI专家赵东岩博士以《人工智能进展及其影响》为主题发表了演讲,现将赵博士讲话抄录如下,与大家共享!
人工智能及其影响 ——赵东岩研究员在强国知识产权新春分享会上的讲话 赵东岩:非常高兴有这个机会,跟咱们做知识产权工作的朋友们做一个交流。作为学校的老师,我们工作也与知识产权相关,我本人申请了几十项专利,跟咱们的知识产权的相关机构包括代理,都有接触。今天,应咱们主办方的邀请,讲一下人工智能的基本概念,以及目前的进展和未来的一些展望。 今天的报告主要包括三个方面。 第一,人工智能及其历史。为什么讲历史呢?现在人工智能又热起来了,但是实际上这个概念是从60多年以前提出来的。既然我要讲的话,希望大家对人工智能有一个稍微全面和深入一些的了解。因此,我们就从什么是人工智能以及人工智能的发展过程开始讲起。 首先是智能,什么是智能?智能这个说法实际上在我们现在生活里面是非常普遍的,比如说智能家电、智能手机。这一类智能通常只是用了计算机的某些算法,在算法应用层面方便了用户的使用,表现得有一些智能。还有,比如说智能交通、智能医疗,从系统或者行业层面提供了智能与自动化的系统解决方案。这些我们所听到的智能是不是智能呢?实际上并不是。智能的定义是这样的:智力和能力的综合。智力实际上是人类和智慧体的智慧水平的体现;而从我们现在讲的机器智能,只是实现了一种类似人的能力。这是目前智能概念的区别之一。智能,它通常指生物的精神能力,包括了学习、理解、语言、思维、计划以及解决问题的能力。同时,对于智力因素,有学者的研究把智力因素分成三类:一种是成分性智力,我们内在的智力,就是心智能力;还有经验式智力,怎样运动习得一个经验,在新场景怎么运用它;第三是情景化智力,结合上下文去创新,在上下文不断变化的情况下,改变自己的行为,这样的一种能力。以上是行为学家和心理学家对智能的认识。而人类智能方面,加德纳提出了一个多元的智能理论,把人的智能化分成了七个范畴:语言、数学及逻辑、空间智能,还有运动能力,音乐能力,人际交往能力,以及自省。实际上人类的智能和动物的智能在这七个范畴的大多数里面,有低级和高级的区别,人类的智能化只是比动物高级一些。以上是智能的基本概念。 什么是人工智能? 人工智能是一个计算机范畴的概念。最早的定义是:使一部机器反应方式就像一个人在行动时所具有的智能,就是说“让机器表现的像人一样”,就是人工智能。抽象一些的概念是这样的:研究开发用于模拟、延伸以及扩展人的智能理论方法、技术和应用系统一门科学,是以计算机科学为基础的学科。 谈到人工智能,必须要介绍图灵问题。这个问题是图灵提出来的,判断计算机是否拥有智能的一个测试任务。下面做一个简要的介绍。 说到人工智能,大家不能不知道图灵——Alan Turing。他是一个英国人,有两个非常伟大的贡献:首先他用数学方法定义了图灵机。到目前为止,所有的计算机系统都是用图灵机的模型实现的。因此,他是计算机之父,第二,他提出了图灵问题,从而定义了什么是人工智能,因此图灵也是人工智能的开山鼻祖。此外,他还是个传奇,这个人热爱运动,是个长跑的爱好者。此外,有一个电影叫《模拟游戏》讲述了他为军方研制专门的计算机,破译密码,截获大量德军情报的事情。但是因为他的性取向问题,图灵岁数不大就结束了自己的生命。他就是这样一个传奇人物。 下面具体介绍下什么是图灵测试,就是图灵所定义的测试计算机是否具有智能的测试任务。有ABC三个角色,下面的C是一个测试者,上面的A和B各自是一个黑屋子里面的计算机和另外一个人。如果这个C不断提问,但从回答上判断不出来A和B哪个是人、哪个是机器,或者他认为都是人,计算机就具有智能。 大家说这个问题难不难呢?其实这个问题的话,难度并不确定,取决于测试标准。我们现在做到什么程度呢?图灵是1954年去世的,去世60周年的时候,英国一所大学做了一次图灵测试,只有俄罗斯的一台机器通过了图灵测试。它模拟多大的人呢?只有13岁;有多少人认为它是一个人呢?只有33%的人认为他是一个13岁的孩子。所以,通过这个测试,大家可以判断出来,其实这个测试还是很难的。到现在为止,我们的人工智能水平其实还是比较初级的。目前在中国的高考机器人项目中,回答地理的选择题,平均能得到50分(百分制),还没及格。虽然这个项目只做了三年,但也说明这个问题还是非常难的。 图灵之所以成为人工智能的先驱,是他在1950年的时候,就在学术论文里面提出了图灵测试,题目是:Computin Machinery and intelligence。1956年,他又以“计算机能思维吗”进行了重新发表。 我们现在认为人工智能通过图灵测试仍然还是一个终级目标。客观的说,目前的人工智能技术还没有达到这个水平。 为什么说1956年是人工智能的元年?除了图灵再次发表的论文,还有一件非常重要的事情,就是说十位来自于大学和工业界的人,召开了Dartmouth会议。这个会议是由McCarthy等四个人发起。他们中有很多大师,这里面有三四个人获得了后来的图灵奖,相当于计算机界的诺贝尔奖。包括香农,信息论的创始人;西蒙,他获得了图灵奖,又获得了诺贝尔经济学奖。 这个会议开了两个月,讨论了人工智能的相关问题。虽然最后没有达成一致,但是会议定义了人工智能的概念,叫(Artificial Intelligence)。通过两个月的会议,人工智能的概念被大家接受,成为了人工智能的开端。 为什么他们没有达成更多学术上的一致?是因为人工智能有不同的学术流派,就是三个“三”的第一个:人工智能有三个流派。 三个流派是什么呢?第一个流派:符号主义。符号主义又叫逻辑主义,就是用严格的数理推导,表达知识,使计算机具有推理的能力,从而表现得智能。代表人物Simon是参与Dartmouth会议的十个人之一。 第二个就是连接主义,用神经元网络和机器学习模型来仿造人的神经系统,用计算模型的方式呈现,用来模拟人类的智能。这个流派的奠基人是Simon,他也是Dartmouth会议的发起人之一。Simon当时还在哈佛,两年之后和McCarthy一起转到MIT成立了第一个人工智能研究所,开启了MIT的人工智能研究。到现在为止,大家对机器学习耳熟能详,所以人工智能发展到目前是连接主义的占了上风。 但是当时并不是这样的(当时符号主义占主导地位)。 第三个是行为主观主义,推崇控制,奠基人是MIT的Winner,他是控制论的创始人,他认为需要通过系统控制让机器具备智能, 这个就是人工智能的三个流派。 第二个“三”是人工智能的三次浪潮。 经过六十多年的发展,人工智能热已经经历了三个浪潮。 第一个浪潮是1956年开始的,经历了20年,以达特茅斯会议为开端。那个时候盛行第一种流派——符号主义。那个时候最成功的案例是定理证明。当时人工智能提出了十大任务,做了很多的事情。真正做好的就是计算机证明定理。除了机器证明,当时还引入符号推理进行语义处理,这就是自然语言处理任务,也是我本人从事的方向,以及人机交互的研究,从那个时期就开始了。此外,那个时候计算机已经能够自动谱曲了,智能专家系统和聊天系统开始出现。 大家看看是不是和现在有点像,当时人们惊呼“人工智能来了”、“再过十年计算机就可以超过人类!”。但是告诉大家,即使从现在看,再过50年,100年,在我们的有生之年(这样的情况)不会发生。当然如果人工智能技术用不好也会带来一些危险,我们一会儿再谈。 第二次浪潮在1976年到2006年。 专家系统和基于逻辑推理的符号主义有很大的局限性。领域知识很难用逻辑完善地表达,所以应用走向深入以后都走不下去了。因此,人工智能开始衰落,符号主义也就不那么盛行了。 从1975年提出了BP算法和80年代提出了Hopfield神经网络开始,人工智能再次兴起。这次是连接主义占了上风。 这一阶段(人工智能)代表性的进展就是1997年IBM的深蓝战胜了国际象棋的冠军,卡斯帕洛夫。 这个阶段人们就进行机器翻译,第五代计算机等项目。但是这些项目受到了数据量和计算机计算能力的影响迟迟没有走入到人们的生活当中。 当时最大的问题是计算能力和数据量不够,无法解决(人工智能任务的)复杂问题。实际上语音识别,机器翻译很复杂,(虽然现在的话已经有非常好的进展),但在当时,受这两个方面的局限,整个系统的性能达不到人类的目标,人工智能浪潮就再次的跌落下去了。 第三次人工智能热潮是从2006年到现在。其实真正热起来(得到社会大众关注)还是最近三年五年的事。 为什么从2006年开始呢?因为2006年,加拿大的科学家Hinton提出了深度学习的技术。当时有三个著名人物,Hinton、 Bengio、Le Cun,两个加拿大人和一个美国人,提出了机器学习的新方法,人工智能重新热起来了。 (这个阶段的)标志性进展,第一个是2011年,IBM做了一个Watson系统,在智能问答节目上战胜了人类的冠军,拿到了最高奖金。这时,大家觉得人工智能回来了;再有,到了2012年,Stanford大学组织的图像识别竞赛上,计算机系统的性能第一次超过了人类(超过了人类的平均水平)。 这个时候为什么会兴起?首先,主要是因为有深度学习的算法。这个深度神经网络,不同于我们上学的时候用两层、三层的神经网络;现在的神经网络可以到上千层,这也是因为现在计算机的计算能力(比当初)提高了。此外,随着互联网和行业应用的广度和深度,目前的数据量已经不是20年以前的数据量可以比拟的了,用大量的数据可以用来学习、用来训练。因此,现在人工智能能够再度兴起。 最近,在语音识别这个方面,机器性能也超过了人,因此(人工智能的进展)还是非常令人鼓舞的。 第三个“三”是人工智能三个层次。 这个也非常重要,这三个层次是什么呢? 一个是计算智能,(计算机)以算力和记忆力超过人类。这个层次上的典型事件是深蓝战胜卡斯帕洛夫。从此以后,人在计算能力上就没办法与机器比拼了 第二个层次是感知智能。感知智能是指计算机具备初级的语义和模式识别能力,就是“知其然——我知道是什么”,达到这个水平。包括OCR,图像识别,语音识别,自动驾驶等任务,都属于智能感知。(感知智能)能知道谁在哪儿,能知道图片或者是摄像机里面有没有人,有没有花,有没有山等,这个就是基础的智能感知系统。感知智能标志性的系统有两个:一个是IMB Watson系统,它在智力竞赛里面战胜了人类的冠军,第二个就是AlphaGo,它战胜了世界冠军李世石和中国的第一柯洁。为什么围棋没有像国际象棋一样在20世纪就突破了?因为围棋不只是计算,围棋另外一个非常重要的方面是形势判断。下围棋的过程中经常面临不同的选择,(不同的选择)可能导致对弈形势的变化。判断形势是什么呢?实际上就是智能感知任务,他不是单纯的计算,为此,AlphaGo引入了“价值判断网络”。也就是说,它不只是算力,还加入了基于深度学习的智能感知功能,最后赢了世界冠军。 第三个,认知智能。 刚才提到的应用基本上都属于感知智能的阶段。认知智能是“知其然,还知其所以然”。 认知智能要求计算机具有理解知识,运用知识进行推理的能力。这实际上就是图灵测试定义的问题和场景,(图灵测试)是需要计算机具备认知智能能力的。 这就是我们所说的这三个智能层次的类别。 目前(人工智能技术)所处的阶段,应该来说是从感知智能向认知智能跨越的临界点。 认知智能里面一个典型的任务就是自然语言处理,就像刚才说的图灵测试里面的问答和对话。 下面简要地说一下,人工智能的发展现状。 可以说现在是人工智能发展的一个关键点,(是人工智能)面向各个领域落地应用的一个突破点。 从(人工智能)技术层面,感知智能逐渐成熟,但是认知智能尚有待研究和突破。 在(人工智能)应用上为什么这么热?就是因为在应用层面,人工智能的技术已经走近大众,并且开始走向我们的生活。如果作为一个类比的话,现在人工智能的状态大概相当于2000年的互联网。 我们都知道,那个时候(2000年)还没有多少人确信互联网会改变我们的生活,大概现在人工智能也处于这样一个状态。 为什么人工智能现在会有这样一个突破性的进展呢?刚才也说了,总结下来就是这三点: 第一个是我们现在有大规模的数据,互联网、移动终端,以及各个领域IT技术的普遍应用,得到的个人与行业数据; 第二个是计算能力,目前的手机,计算能力远远超过上个世纪普通小型机的水平,更别说(目前的)高性能计算机。这个也是非常重要的。 第三个是深度神经网络这样的机器学习算法等的普遍应用。 目前,机器学习方法层出不穷,对于计算力的要求越来越高。随着相关算法的应用,反过来对数据量的要求也越来越高。那么深层神经网络用多大的数据规模来训练(Training)呢?如果有成百上千层的网络,一般需要有千万、亿级规模的数据量,要有足够多的大数据,才能够让人工智能水平得到应用级别的突破。 目前AI的应用方向,包括智能问答,语义搜索,还有图像级别,知识图谱等;目前比较热的应用方向包括自动驾驶和(很多创投公司做的)图像识别领域;再有就是语音识别。科大讯飞在互联网上通过云计算平台获得了几亿人音频数据,利用这些大数据,现在在普通话和主要方言的语音识别能力,已经有了飞速的提高,从一开始的实验室水平,到现在90%以上的准确率,已经完全达到了商用的目标。 此外,人工智能的应用热点还有机器翻译。机器翻译的突破与语音识别非常类似,当某一种语言的文字翻译到另外一个语言的文字的翻译数据量非常大的时候,就可以利用深度学习模型来完成机器翻译任务。因为我知道很多个从英语一句话应该怎么翻译成汉语的平行语料,就可以像一个人一样,不加思索地把“听到”的一句英语用中文表达出来,完成一种文字串到另外一种文字串的转换。 还有聊天系统,有上亿的语料,经过训练,一个问题就会给你一个最接近的回答。 我们已经提到了两次的IBM的Watson系统,从它回答的问题上看还是很难的。比如,“Kathleen Kenyon在Joshua提到的城市的发掘表明,该城的城墙曾被修复17次,为什么?” 为了寻找竞赛问题的答案,Watson系统事先分析了大量文本,一百万本以上的图书,有上亿条知识。系统通过问题分解以及及其与这些文本的语义分析和对比,查询到文本里面线索最相似的答案,通过排序推荐置信度比较高的结果,正确回答了上面这个问题。其实这是一种语义搜索的任务框架。 第二个典型的案例是知识图谱。这个任务与我们做的工作(知识产权)比较相关了。知识产权需要管理和搜索知识;而知识图谱是一种人工智能时代的知识管理技术。 知识图可以把每一个实体(知识点)及其属性、与其他实体之间的关联关系存储下来,提供基于语义的查询。不但“在某些知识点方面的专利”,而且“某些专利点上是不是有冲突”都是可以查到的。 目前最大的知识图谱已经达到了百亿(三元组)的规模,可以存储大规模的跨领域的知识,结构是“主体”“谓词”“客体”的三元组,结构比较简单,适合计算机处理。 这是一些典型的知识图谱,包括国内和国外的。大家可以看到,比较大的知识图谱,谷歌的知识图谱,的规模已经达到200亿。 知识图谱的应用,实际上需要解决三个方面的问题。 第一个是知识图谱的构建。例如,从专利的文本当中抽取知识点,构建出相应的知识图谱。 第二个需要存储。因为知识图谱有大量的数据,,并且需要支持大规模知识图谱的基于语义的查询方式。 第三个需要人工智能(AI)的应用,与问答系统和对话系统结合起来。时间关系,我们在知识图谱所做的详细工作就不讲了。 要用好知识图谱(这样的)技术,比较难的一点就在于知识的问答,也就是说,机器如何把一个问题跟知识图谱里面相应的实体概念及其关系关联起来?这个时候怎么做呢?这时需要把自然语言转化成基于知识库的结构化查询的描述。这个是非常核心的技术,我可以演示一下我们所做的在法律方面的智能对话系统。 我代表当事人问“200元算不算犯罪”,根据刑法法条,主体,客体,主观条件,客观条件等四个方面,计算机会与当事人对话,问当事人的基本情况,事件发生时间,当事人的行为是否正常,在哪里盗窃的等等,通过一系列问答,最后判定当事人到底是不是一个犯罪。 这样的问题是很复杂的:在公共场合和在家里的偷盗行为是不一样的,你偷陌生人和拿爷爷奶奶这样的亲人的钱也不一样。我们的系统最后正确地判定了因为这个人是在商场里面偷了200元(法律规定,在公共场合,偷多少钱都是犯罪;而通常偷200元是不算犯罪的) 最后简要说一下人工智能的前景。 首先,人工智能是战略发展的方向。在20世纪的后半叶人工智能就被列为三大尖端技术之一,和之并列的是空间技术和能源技术;到21世纪人工智能又被列为三大尖端技术之一,与之并列的是基因工程和纳米。 我们根据现在(人工智能)的应用和技术发展的阶段性进展情况来判断的话,有望突破的方向,首先是感知智能的应用,包括图像语音识别,自动驾驶和陪护机器人。 第二,在特定领域受限条件下的人工智能任务是可以实现的。这些是什么呢?就像刚才演示的,机器人可以根据当事人的行为判断其是不是违法的。在一个领域里面具备了大规模数据的情况下,计算机就可以表现得非常像专业人士。 因此,现在人工智能任务的突破瓶颈在什么地方?不在算力,也不在模型,首先在训练样本的数量上。我们做对话系统的时候,比如法律对话系统,如果没有那么多律师和当事人的对话素材,做好法律对话系统就非常难。因此,这个突破有待于哪个领域具有大规模的数据。 比如自动驾驶。大家听说过很多年了,至少五年以上,为什么现在还没有车真正的脱离人工的控制开在路上,就是因为现在的机器学习是case-by-case的学习。日常行车状态下有大量的数据可以学习。举一个例子,车辆传感器可以将飘雪花识别出来还有落一个树叶、跑出个动物,以及落一个雪球,冰雹等,因为这些情况都可能会影响自动驾驶的行为。这些情况下,有时候自动驾驶处理方式是相同的,有时候处理方式是不同的,但是机器不能举一反三,必须将所有的例子一个、一个地学。这就是直到今天自动驾驶还不能上路的主要原因。目前(智能驾驶)只能在园区里面,一个受限的环境中应用。所以,人工智能的应用还是有个很重要的前提条件的。 抛开这样的局限性,我们畅想一下,如果机器能够真的理解文本、具备对话能力的时候能达到一个什么样的水平?最基本的,计算机不再按照关键词匹配搜索答案,机器可以做智能的语义搜索,可以做智库系统和情报分析系统,代替人的繁杂的工作。如此同时,如果机器还具备问答能力,就可以实现辅助诊疗和智能审判应用了;如果还有足够的对话能力,机器可以做更复杂的工作,包括理财顾问机器人,法律助理等。 最后畅想之后需要强调一点,我们要谨慎看待人工智能热。 虽然人工智能是一个战略方向,现在又比较热,但目前的人工智能技术框架还是有明显缺陷的。 刚才已提了一些,现在我们稍微梳理一下: 最大的缺陷在于深度学习,目前这类模型仅适合大规模数据条件下应用,无法有效的解释和运用知识。知识是什么?知识是符号系统里面的带有语义的符号和逻辑规则。现在科学家们,包括我们在内,还在研究如何将知识(符号表示)融合到深度神经网络里面去。 机器学习框架还缺乏推理机制,仅是端到端的计算过程,有点像条件反射,不能做到举一反三,不能像人类一样,运用日常生活常识,在自动驾驶的场景中通过简单推理把雪花、树叶和石头等下落的物体智能地分开对待。 而且AI应用领域还有一些伦理问题。比如,如果真正有一台自动驾驶的车辆了,是不是需要百分之百保护乘车人的安全?如果前方一个人逆行了,你变道安全性是99%,而如果正面撞他,乘车人的安全性是100%,自动驾驶系统怎么选择?是机器帮乘车人选择还是有乘车人自己来选择,相关责任是谁的?这些问题还有待探索。因此人工智能实际上还是有很长的路要走的。 总体来看,人工智能的发展情况还是比较乐观的,因为目前人的智力远超机器,机器还是机械模仿,所以AI在未来的50年,100年将会帮助人类摆脱更多繁重和危险的工作,我们还不必担心机器还取代人类的工作。 我的报告就到这里,谢谢大家。
转载此文章须经权利人同意,并附上完整出处与作者信息;本站首发文章,文章不代表QGIP.NET立场,如若转载,请注明出处。