这是一个激动人心的时代,也是一个令人失望的时代;这是一个让人对未来心生向往的时代,也是一个令人对未来心存忧虑的时代;这是一个让人明晰贯通的时代,也是一个使人疑惑误解的时代;这是一个催人奋发上进的时代,也是一个促人浮躁迷茫的时代1。如果狄更斯在世的话,他也许会这样描述当今人工智能(Artificial Intelligence, AI)所处的状况。
对于人工智能,在可预见的及更遥远的未来,我们应该期待什么?这个问题对做人工智能的和用人工智能的都是一个很重要的问题。本文对此论述自己的浅知拙见,以激发大家的思考。
我们应该对人工智能期待什么?
强人工智能与弱人工智能
人工智能分强人工智能和弱人工智能。简单地说,强人工智能的目标是在计算机上完全实现人类智能,甚至超出人类智能;弱人工智能是部分实现人类智能,使计算机成为人类的智能工具2。
强人工智能是否能够实现尚不清楚,至少从情感、创造力和自由意志几个方面看,在现代计算机上实现强人工智能是非常困难的。
表1从几个角度对人脑和计算机进行了比较。可以看出,现代计算机和人脑在规模上已经相当,人脑大概有1000亿个神经元,1000万亿个突触;一个典型的计算机大概有100亿个晶体管。两者的架构却截然不同,人脑的架构是紧密连接型,计算机的却是稀疏连接型。处理速度上,计算机有很大优势,基本是人脑处理速度的100万倍。但是,人脑进行的是并行处理,计算机进行的是顺序处理,所以在处理某些问题上人脑的效率更高。人脑和计算机在能力上有很大差别,计算机的处理都是基于数学模型的,而人脑做的感知、认知处理很多都很难用数学模型,至少现在很难用数学模型刻画。
为什么在现代计算机上实现情感、创造力以及自由意志这些人类智能的基本能力还极具困难?
喜怒哀乐是人的基本情感。现代科学认为,情感主要是在人的大脑边缘系统(下意识)产生,在人的智能活动中起着重要作用。比如最典型的情感——恐惧,当人感受到危险时,边缘系统中的杏仁核瞬间产生化学物质,促使身体进入紧张状态,心跳加快,呼吸加速,开始攻击或防御行动,同时信息传到大脑皮质(意识),这时人才意识到发生了什么。有人或许会问:如果一个人没有情感的话,他的判断是不是都是理性的?结论是否定的。有一些病人,不幸因大脑受伤丧失了情感功能,后来观察发现,离开了情感他们在日常生活中很难做出理性的判断。神经科学的权威达马西奥(Antonio Damasio)在他的名著《笛卡儿的错误》一书中,详细介绍了这些病例,论述了情感对理性及智能的重要作用[2]。可以看出,情感涉及化学现象,能否在电子计算机上实现是个很大的疑问。
人拥有创造力。创造力的主要特点是把看似不相关联的东西联系在一起。著名的认知科学家雷科夫(George Lakoff)等做了大量研究,他们在名著《我们赖以生存的比喻》中指出,比喻是语言的一个重要特性,比喻的使用是人类创造力的体现[3]。比如我们说“在微信里面潜水”就是一个比喻,这个比喻把两个看似不相关联的事物——潜水和(在微信里面)沉默联系起来。人们第一次发明这个说法,或者第一次理解这个说法时,都会思考这两个概念联系在一起的意思。让计算机拥有这种创造力意味着进行某种全局的相似度计算,尚不清楚如何实现。
人的另外一个重要特点是拥有自由意志,即意识能够支配自己的行为。人脑信息处理的大部分,有人说高达98%,都是在下意识进行。人工智能创始人之一明斯基(Marvin Minsky)在《心智社会》一书里提出了人脑是由许多智能体构成的社会的想法[4],也就是说,下意识可以看作是许多智能体组成的社会,它们各自独立的且协调的作用构成了下意识。最新研究发现,下意识对意识的决定,对人的智能起着重要作用。具体地,人在做判断的时候,下意识有时超前于上意识提前做出反应,比如,有大量实验结果显示,意识做出举手的决定时,这个决定在500毫秒之前下意识已经做出。这好像在一个组织里表面上决策是领导做的,其实在那之前部下已经提出建议。自由意志仍是一个热门的研究课题[5],可以推断实现这样的功能需要全新的计算机架构。
机器学习的优势与局限
假设有一个(弱)人工智能系统,能够智能地完成某种任务,它应该具有以下功能:从外界环境得到输入,识别其特点,理解其内容,在此基础上进行推理,最后做出决策,对外界环境实施操作。对应人的识别、理解、推理、决策能力,第一部分被称为感知、后三部分被称为认知,如图1所示。
现在人工智能主要依赖于机器学习,特别是监督学习,比如分类、回归。机器学习可以基于数据,帮助智能系统做出各种各样的判断,可能对应于感知的处理,也可能对应于认知的处理,比如识别一张照片里面是不是有人脸,或者判断在下围棋时该走哪一步。近年深度学习有了突飞猛进的发展,成为机器学习中最强大的一个分支。机器学习本身并不具备推理能力,机器学习与推理的结合,会使系统的智能水平提升到更高的高度,是未来人工智能技术发展的大方向。
机器学习既有优势,也有局限。
机器学习的优势是,数据驱动,在特定场景下做出的判断,可以逼近甚至超过人类。这一点在汽车自动驾驶,在计算机围棋系统AlphaGo中已经得到充分体现。AlphaGo系统有两个模型,被循环使用,在不同的棋局中,帮助系统做出判断。这样一个简单的架构就能完成非常智能的工作。
机器学习也有若干局限。第一个局限是严重依赖于数据,如果训练数据的质量不够好,就可能导致系统学到不全面或不正确的模型。极端情况,如果完全没有数据,那么机器学习也面临“巧妇难为无米之炊”的困境。比如人脸检测,如果给出的训练数据不充分,系统就很难检测出在各种情况下照片中的人脸,人在墙后露出半张脸或者把脸捂上的时候,系统就无法检测。如果想让系统能够覆盖这些情况,就要给系统提供充分的训练数据。数据驱动是机器学习的重要特点,换句话说也是它的局限。
机器学习的第二个局限是依赖于学习模型的类型3。构建机器学习系统时,需要事先决定模型的类型,或者说定义模型的可能集合,比如做分类时,需要决定要学习的模型是线性模型还是非线性模型。如果问题是非线性问题,而选择的是线性模型,那么分类的效果就不会好。模型类型的选择左右了机器学习系统的性能。深度学习的本质是复杂模型的学习,近年深度学习的突破主要源于大数据的普及以及计算机能力的提升,这些使得复杂神经网络学习成为可能4。
不能执行不特定多种任务,这是机器学习的第三个局限。可以把智能系统做一简单分类(图2),首先看环境是否动态变化,如果环境不是动态变化的,这样的智能系统可能就是工业机器人。如果环境动态变化,其次看智能系统是否需要执行不特定多种任务,也就是说要做的事情是否已经事先定义好,只能执行特定多种任务就是汽车自动驾驶的情况,比如“直行、刹车、换道”。如果任务是不特定多种,那么基于机器学习的智能系统就难于应对。假想有一个建筑机器人,这个机器人可以搬砖、摆砖,但是它可能不会清理倒掉的砖墙。如果没有设计让机器人完成的任务,机器人就不会像人一样自主地去做。构建一个能够像建筑工人一样去工作的机器人,还是极其困难的。智能系统和任何一个工程系统一样,都只能在设计范围内工作。
人工智能的发展机遇
目前(弱)人工智能主要基于机器学习和大数据,也就是说,现在的人工智能只有机器学习这一“招”,还没有和推理等结合起来。但是,就是这一基本技术已经能把人工智能做得非常强大,我们已看到很多成功案例。阿基米德曾经说过,“给我一个支点和杠杆,我能把地球撬起来”。对于人工智能研究人员来说,给我们机器学习和无穷多的数据,应该也能实现人工智能。
几乎所有人工智能系统都遵循这样一个规律,我们称之为“人工智能闭环”,是由系统、用户、数据、算法构成的闭环(图3)。先有系统,之后有用户,然后产生大量数据,机器学习算法基于数据构建模型,提高系统的性能,系统性能提高后又能更好地服务于用户,形成一个闭环,不断迭代,系统变得越来越智能。现在这个闭环还多半需要人的参与,如果智能系统能够自己在这个闭环中迭代,那么智能的水平又会上一个台阶。
所以,如果要用现在的技术构建人工智能系统,需要做的就是快速建立人工智能闭环。而人工智能的研究,焦点也是如何开发强大的机器学习算法,支撑这个闭环。如果未来机器学习能与推理、知识等结合,人工智能的闭环将会发挥更大的威力。
人工智能将改变所有行业
人工智能将改变包括金融、医疗、通信、教育、交通、能源在内的所有行业,基于人工智能技术的升级是未来各个产业发展的必然趋势。诺亚方舟实验室正在针对华为的主要产品在通信、手机、云计算等方面做人工智能技术的开发,目标是让这些产品更加智能化,更好地为用户服务。以下以通信行业为例,介绍人工智能可能带来的巨大变化。
未来通信网络
未来的通信网络将变得更加自动化和智能化。通信网络通常有两大任务:网络控制、网络管理和维护。网络控制方面,基于人工智能技术,可以让网络的使用效率得到更高的提升;可以让网络的资源得到更有效的利用。网络管理和维护方面,基于人工智能技术,可以做出更加合理的网络设计、设备部署;可以更加准确地监控网络的状况,预测网络可能发生的问题;一旦网络发生故障,能够帮助工程师及时排除故障。
智能流量控制系统NetworkMind
软件定义网络(Software Defined Network, SDN)被认为是通信网络未来发展的方向,其基本思想是将通信网络中的硬件和软件解耦,更好地进行网络控制,但是如何实现网络的控制逻辑仍是一个未解问题。
诺亚方舟实验室开发了NetworkMind系统,目标是通过人工智能技术实现软件定义网络的网络流量控制。部署在软件定义网络中的NetworkMind,可以自动观察网络流量状况,预测网络流量变化,在其基础上做出数据流的路由决策。系统全部基于机器学习,特别是控制的部分基于深度强化学习。NetworkMind被首先应用于数据中心的软件定义网络。数据中心有许多服务器,由软件定义网络连接,用户在上面执行不同的分布式处理任务,网络流量动态地发生变化,NetworkMind能够根据网络的状况自动做出路由决策,使网络的传送效率大幅提升,完成任务的平均时间比业界已有方法缩短了50%。
NetworkMind中的深度强化学习模型如图4所示,“动作”表示所有可能的路径,“状态”表示各个链路的容量、使用的状况,“奖赏”表示完成任务的时间,Q函数由深度网络实现。
智能故障诊断系统
智能故障诊断系统可以帮助网络维护工程师迅速地排除网络故障。华为有两万名工程师每天24小时维护全球1/3的通信网络,一旦网络发生故障,工程师需要在很短的时间里排除故障。如何帮助工程师提高工作效率是一个非常重要的问题。华为有所有网络故障的历史记录,有工程师用中文或者英文整理出来的网络维护知识,我们的诊断系统可以从已有的数据里自动构建通信领域知识图谱,同时构建在知识图谱上进行概率推理的机制。整个系统以自动问答的形式呈现,工程师通过自然语言描述遇到的问题,系统用自然语言问答,帮助工程师找出故障的根本原因,以及给出排除故障的方案。
智能故障诊断系统使用了卷积匹配模型(见图5),诺亚方舟实验室提出的这个深度学习模型是自动问答领域具有代表性的工作[6]。在自动问答中,针对给定的问句、答句,通过二维的卷积神经网络抽取问句和回答的特征,以及问句和答句相互关联的特征,然后对这些特征进行筛选,最后做出问句和答句关联度的判断。使用训练数据学习这个模型,帮助系统做出准确的回答。目前系统的回答准确率在70%左右。我们还在不断改进这个系统,希望今后能够更好地服务于工程师。
结语
机器学习权威乔丹(Michael Jordan)教授在IJCAI 2016的报告中表达了他对当前人工智能发展的担忧,“人工智能将何去何从?(当前)有太多的混乱,不区分什么是已经实现的,什么是能够实现的,什么是可能能够实现的。有太多的混乱,不区分什么是科学,什么是科学幻想。”对于人工智能的未来发展,我们应该抱有正确的期待,这一点是至关重要的。
笔者认为,人工智能将给我们带来非常美好的前景。人工智能是强大的,但是,对其期待也不能过高。在现在的计算机上实现“强人工智能”还是非常困难的。在可预见的未来,人工智能还主要靠机器学习,也有可能会与推理等结合起来,但能够实现的还是“弱人工智能”。虽然如此,机器学习在特定场景下的判断已经能够逼近或超过人类。在大数据时代,基于机器学习的人工智能闭环能使系统变得越来越智能。人工智能技术会改变所有行业。在华为诺亚方舟实验室,我们针对华为的主要产品在做人工智能技术的研发,希望能够使这些产品更加智能化,更好地为用户服务。