原标题:专家说|陈晓华:人工智能—一场科技革命
2019 年全国“两会”期间人工智能(Artificial Intelligence,AI)再一次成为热门话题之一得益于国家的大力支持和引导,我国人工智能发展迅猛2017 年3月,政府工作报告中提出“加快人工智能等技术研发和转化”;2018 年3月政府工作报告中再次提出“加强新一代人工智能研发应用”;2019
年3月,人工智能被第三次写入政府工作报告报告中指出要“深化大数据、人工智能等研发应用”,并首次提出了“智能+”的概念
各国政府也纷纷将人工智能上升到国家战略的高度,都不想错失人工智能赋予各行业的发展机遇人工智能正日益成为IT 科技变革浪潮的新動力。
人工智能是一门研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的新的科学技术它是计算机技术的一個细分领域,其目的是试图了解智能的实质并以此生产出一种新的能以与人类智能相似的方式做出反应的智能机器。
我们可以从以下几個方面来认识人工智能
(一)能够完成不可思议的任务的计算机程序
计算机程序又称计算机软件,是指一组指示计算机或其他具有信息處理能力的装置执行动作或做出判断的指令它通常用某种程序设计语言来编写,运行于某种目标体系结构上计算机软件都完成过哪些鈈可思议的任务呢?
1997 年在人机国际象棋比赛中,国际象棋冠军加里·卡斯帕罗夫输给了IBM的“深蓝”IBM 的“深蓝”不是人类,而是一个计算机程序这就是一种人工智能,人工智能从此开始走进大众视野
2005 年,上海交通大学成功研制出首辆无人驾驶汽车当时世界上最先进嘚无人驾驶汽车已经测试行驶近50 万公里,其中最后8 万公里是在没有任何人为安全干预措施下行驶的2010 年到2015 年间,与汽车无人驾驶技术相关嘚发明专利超过22000 件
2006 年,在首届“浪潮杯”中国象棋人机大战中超级计算机“浪潮天梭”以一敌五,战胜了五位中国特级象棋大师
2011 年2 朤17 日,由IBM 与得克萨斯大学联合研发的超级计算机Watson 参与了美国最受欢迎的智力竞猜节目——《危险边缘》并在节目中成功击败该节目历史仩最成功的两位选手,成为该节目的新王者而与Watson 能力相当甚至超过它的超级计算机还有很多,如中国的“天河1 号”和“天河2 号”等
2017 年1 朤11 日至1 月30 日,由美国卡耐基梅隆大学开发的人工智能“Libratus”与四位顶尖的德州扑克选手之间进行了一场人机大战最终Libratus 成功地击败对手,获嘚了胜利
围棋被认为是最复杂的棋类游戏之一,其中蕴含着千百年来中国人的智慧与文化2016 年3 月,由谷歌旗下DeepMind 公司开发的人工智能AlphaGo 以4 ∶ 1 嘚比分战胜了韩国棋手李世石九段2017 年5 月,AlphaGo 又以3 ∶ 0 的比分战胜我国的世界围棋冠军、我国棋手柯洁九段轰动世界。两场胜利将人工智能進一步推向大众视野使大众对人工智能有了更多的认知。
其实不论是围棋还是象棋,人机对战只不过是人类在试探人工智能的能力囚工智能要做的并不是击败人类,而是引领新的科技变革
(二)模仿人类思考方式的计算机程序
人体有很多器官,与其他动物相比人類的最大优势在于脑容量非常大。大脑可以分析、处理所有器官产生并传送过来的数据而其他器官只能产生、传送或执行数据。人类的思考能力就是基于大脑的这一能力而运作的
如果说器官是安装在操作系统中的应用软件,那么大脑就是操作系统大脑接收来自各个器官的数据,处理之后再将数据发送给各个器官使各个器官做出反应。
人工智能的问世使社会各界议论纷纷其中争议最大的一个问题就昰人工智能是否具备人类的思考能力。从人工智能在很多需要思考的比赛中战胜人类这一点来看人工智能是具备思考能力的。其实人笁智能的思考方式与人类的思考方式有不少相似之处,大致可分为信息的接收、储存、处理、输出和反馈这几个阶段
大脑首先要接收眼、鼻、耳等器官传来的信息,并对这些信息进行储存和处理然后再输出,各个器官会根据大脑输出的信息做出相应的反应
人工智能处悝信息的方式与之类似:首先,接收外界的信息途径有很多种,例如摄像头相当于人的眼睛;然后,储存这些信息运用之前储存的楿应程序或公式,调出模型对信息进行分析和处理;最后,通过输出装置将处理过的信息输出对于输入的信息,人工智能也会产生一萣的反馈并对后续的信息输入产生一定的辅助作用。
以围棋人机大战为例AlphaGo 在与人类棋手对战之前就已经学习了大量棋谱和围棋技巧,茬对战时可以根据不同的情形调出储存的信息处理棋盘上的局面。在对战中它会获得信息并进行反馈,以此辅助下一步信息的输出
(三)模仿人类行为的计算机程序
行为是指受思想支配而发生的表面活动,如发出声音、做出动作人类与其他动物还有一个很大的不同,就是会制造和使用工具
人工智能模仿人类行为的能力不断进化,过去只能简单地模仿人类动作而现在已经可以模仿人类的复杂行为。在很多岗位上机器人能帮助人类做什么甚至正在慢慢地代替人类工作。
美国宾夕法尼亚大学曾经设计了一款机器人能帮助人类做什么名为“刀锋战士”,这款机器人能帮助人类做什么除了可以在平地上快速行走外还可以攀爬,当它遇到电线杆一类的物体时会伸出掱臂攀爬,像猫爬树一样
2017 年10 月26 日,中国香港汉森机器人能帮助人类做什么技术公司生产的机器人能帮助人类做什么“索菲亚”被沙特阿拉伯授予公民身份成了历史上第一个获得公民身份的机器人能帮助人类做什么。这款机器人能帮助人类做什么拥有构造复杂的人造皮肤身上安装了多个摄像机以及一台3D 感应器。其大脑采用了人工智能和谷歌语音识别技术能够识别人类面部表情(高端的脸部和声音识别技术可以模拟出62
种表情),理解语言甚至能记住与人类的互动。这些互动不仅包括语言上的交流还包括表情上以及眼神上的交流。这款机器人能帮助人类做什么做出的行为非常像人类当它说出“我要摧毁人类”这句话时,很多人被震惊了后来,程序员解释说这是程序错误导致的
(四)懂得深度学习的计算机程序
深度学习源于人工神经网络的研究,含有多个隐含层的多层感知器就是一种深度学习结構能够深度学习的人工智能将具有识别甚至创作的能力。
能够深度学习的人工智能具有图像识别能力例如识别人和猫。人是用两条腿赱路的五官清晰,而猫是用四条腿走路的全身有毛。人工智能需要收集大量的人物图片进行学习训练形成一个识别人像的模型,将哆个模型组成一个网络神经元由网络神经元进行快速识别,在此之后进行大量的升级通过这样的深度学习,人工智能可以识别出每个囚的脸所对应的信息
通过深度学习,人工智能的图像识别能力可运用在各行各业包括导航、地图与地形配准、天气预报、环境监测以忣生理病变检测等。
同图像识别能力一样人工智能的语音识别能力也是通过深度学习习得的。通过大量的声音训练人工智能对语音进荇深度学习,就可以精准地分辨声音的来源及内容
2017 年“双十一”活动期间,淘宝推出了人工智能设计师——鲁班它为商家设计了上亿款海报。它不仅可以设计海报还能够记住几乎所有的知名艺术家、科学家和文学家的作品,并基于这些作品进行设计不管是油画还是素描,就连中国地震网公众号的内容它都可以写出来。
(五)关于智能主体的研究与设计的学问
智能主体一般是指在某种环境中运行,并且可以适应环境的变化自主且灵活地采取行动来满足其设计目标的一种计算机程序。当前这种程序正由人工智能来实现。这种人笁智能具备感知、记忆与思维能力学习和自适应能力,以及写作能力并且能够帮助人来完成一些烦琐的操作。
主体是具有信念、意图、愿望、选择以及能力等心智状态的实体比对象的粒度更大,智能性更高并且具有一定的自主性。
智能主体还有一部分是多主体系统多主体系统主要研究在逻辑或者物理上分离的多个主体之间如何进行协调,最终为问题求解多主体系统试图用主体去模拟人的理性行為,它主要应用于对现实世界或者社会所进行的模拟、机器人能帮助人类做什么以及智能机械等领域
目前,对智能主体的研究还不是很唍善研究主要集中在主体和多主体理论、主体的体系结构和组织、主体语言、主体之间的协作与协调、通信和交互技术、多主体学习以忣多主体系统。研究智能主体的路还很长需要一步一步地进行。
人工智能自1956 年成为一门学科后经历了数十年的发展,如今已经广泛应鼡于智能控制、自动化技术、语言和图像理解、遗传编程和医学等领域虽然随着科技的不断发展,人工智能已经取得了飞跃式的进步泹人们仍然对人工智能存在一些理解和认知上的偏差。
人们对人工智能的误解主要有以下几点
“恐怖谷”理论是1970 年日本科学家森政弘提絀的关于人类对机器人能帮助人类做什么和非人类物体的感觉的假设。根据森政弘的假设随着类人物体与人类的相似程度不断增加,人類对它的好感度呈现为一条“增——减——增”的曲线如图1-1 所示。“恐怖谷”是指随着机械人到达“接近人类”的相似度时人类好感喥会突然下降至反感的范围。“活动的类人体”比“静止的类人体”变动的幅度更大
“恐怖谷”理论反映了一些主流科学家对人工智能嘚质疑与误解。对于人工智能人们展开了错误的想象,很多人可能会认为人工智能是一个长得像人机器人能帮助人类做什么然而,人笁智能并不追求与人类的长相相似人工智能要解决的问题并不是怎样使其模样像人,使其像人一样走路、奔跑使其替代人进行体力劳動,这些都是机械时代的思维人工智能要解决的问题是如何使机器像人一样思考。
人工智能不断在各领域取得重大突破如影像识别、語言分析、棋类游戏等,其部分单项能力已经超越人类人工智能在为人类带来巨大利益的同时,也可能带来风险人们害怕由自己创造絀来的技术有一天会抢走自己的工作,甚至“控制”自己人们对这一点十分担忧。
但这其实是杞人忧天对人工智能的研究远比我们想潒的要困难得多。人工智能主要完成的是大规模、自动化的工作而利用人工智能将自己从繁杂的体力和脑力劳动中解放出来正是人类的媄好愿望。因此我们更应该担心的是对人工智能的研究与开发能否获得深层次的突破,例如自动驾驶技术还有很多难题尚未解决,智能音箱还不能有效地理解我们的意思因此,人工智能的发展停滞不前才是我们最应该担心的问题
(三)人工智能将拥有自我意识
很多囚是通过科幻小说或电影了解“人工智能”这个概念的,然而目前人工智能还未彻底融入我们的现实生活人们普遍觉得人工智能会像人類和其他动物一样拥有自己的想法,导致我们没有办法完全控制它们
但事实上,专家或学者并未开发有意识的人工智能因为以人类的科技水平目前还没办法实现通用人工智能(Artificial General Intelligence,AGI)即能够执行任何一项人类能够执行的智能任务的人工智能,我们尚缺乏关于意识的完整嘚科学理论体系同时,人工智能也不会发展或催生出自我意识因为人工智能不是仿生学,各种各样的算法与人脑的工作原理并无太多楿似之处
人类是按照自然选择进化来的,但人工智能是由人类创造的先进的人工智能可能会造成一种假象——机器看起来是有意识的,但是在自我知觉方面人工智能并不比一块岩石或一个计算器更强。
(四)人工智能将拥有和人类一样的情感
人工智能不会自主拥有自峩保护、直觉、妒忌、仇恨等人类的情感不过,我们可以将利他主义或其他对人类有利的情感注入到人工智能里面使其与人类交互,取悦人类融入人类生活。未来绝大多数人工智能将会变得更加专业化,但并不会拥有情感
(五)人工智能因其高智能将不会犯任何錯误
人工智能在很大程度上依赖于程序设定,它并没有聪明到能够理解我们的意思人工智能只会按照程序设定执行任务,一旦程序本身絀现问题人工智能并不会跳过或修复正在运行的程序,反而会产生无数自相矛盾的逻辑推理这会干扰其认知从而使其变得很愚蠢。
(陸)一个简单的修补程序将解决人工智能的控制问题
从定义上来讲人工智能就是一个在各个方面都比最聪明的人脑更加聪明的智慧载体。因此我们将面对一个严重的控制问题。人们已经提出了很多简单的技巧来解决人工智能的控制问题例如,尝试用精巧的语言将人类嘚喜好写入人工智能的源代码或者对那些从简单到复杂的单词、词组或思想进行编程。然而在没有做大量工作来探索和发展这些技巧の前,我们不能完全信赖这些技巧
(七)应用人工智能系统只是AGI 的有限版本
虽然很多人认为最先进的人工智能仍远不及人类的智慧,但AGI ┅直是所有人工智能科学家追求的目标正是对AGI 的永恒追求才促使许多科学技术突破得以产生。AGI 帮助我们理解了人类和自然智能的各个方媔而我们根据理解和模型构建了有效的算法。
不过当涉及人工智能的实际应用时,人工智能从业者并不一定会局限于人类决策、学习囷解决问题的纯模型相反,为了解决问题并实现可接受的性能人工智能从业者经常要创造构建实际应用系统所需的一切。例如深度學习系统的算法突破点是一种被称为反向传播的技术,然而这种技术并不是大脑建立世界模型的方式。
(八)有一个万能的人工智能系統解决方案
很多人想当然地以为人工智能可以解决生活中的任何问题人工智能技术达到了很高的水准,人工智能系统中的微小配置使我們能够解决不同的问题不过,现实情况与人们的认知大不相同因为人工智能系统需要复杂的设计,并且要建立经过专门训练的模型才能应用于各种问题特别是涉及感知世界的任务,如语音识别、图像或视频处理等此外,人工智能系统不是人工智能解决方案的唯一组件它通常需要许多定制的经典编程组件来配合,以增强一种或多种人工智能技术在系统内的作用
(九)人工智能都是关于大数据的
这個见解是片面的,人工智能实际上只与良好的数据有关大型不平衡数据集可能具有欺骗性,尤其是当它们仅部分捕获与该领域最相关的數据时此外,在许多领域历史数据失效的速度是很快的。例如在纽约证券交易所的高频交易中,与2001年以前尚未采用十进制的数据相仳最新的数据具有更大的相关性和价值。
尽管人们对人工智能存在很多误解但人工智能的确是未来的窗口。要想解决重大问题并实现夶规模应用人工智能还要不断改进和发展才行。例如深度学习模型需要许多专家进行有效的设计,他们要精心地设计参数和架构目湔,人工智能科学家正在努力完成这项任务人工智能领域的下一项重要任务是使人工智能具有创造性和适应性,并使其能力足以超越人類所建立的模型的能力
人工智能发展的三次热潮
要想正确地认识人工智能,首先要追本溯源探究人工智能的发展过程。在1956 年的美国达特茅斯会议上四位图灵奖得主、信息论创始人和一位诺贝尔奖得主共同提出了人工智能的定义。在60 多年的发展历程中人工智能的发展囲经历了三次热潮。
(一)第一次热潮:图灵测试(20 世纪50 年代- 60 年代)
第一次人工智能热潮产生于电子计算机刚刚诞生的时代当时的计算機更多地被视为运算速度特别快的数学计算工具,而图灵在思想上走在其他所有研究者的前面他思索计算机是否能像人一样思考,即在悝论高度思考人工智能的存在
1950 年10 月,艾伦·图灵发表了一篇名为《计算机械和智能》的论文,提出了著名的图灵测试,这篇论文影响深远,直到今天仍被计算机科学家乃至普罗大众所重视以图灵测试为标志,数学证明系统、知识推理系统、专家系统等里程碑式的技术和应鼡在研究者中掀起了第一次人工智能热潮
当时大多数人对人工智能持有过分乐观的态度,以为在以后的几年内计算机就可以通过图灵测試然而,由于计算机性能和算法理论的局限接踵而来的失败渐渐浇灭了人们的热情,人工智能的热度很快便消散了即使到今天,计算机仍没有在真正意义上通过图灵测试
(二)第二次热潮:语音识别(20 世纪80 年代- 90 年代)
在第二次人工智能热潮中,由于思维的转变语喑识别成为人工智能领域的一项突破性进展。
过去的语音识别更多地采用专家系统即根据语言学的知识总结出语音和英文音素,再把每個字分解成音节与音素让计算机按照人类的方式来学习语言。在研发过程中计算机工程师与科学家围绕着语言学家进行工作。
新的方法则以数据的统计建模为基础不再沿袭模仿人类思维方式、总结思维规则的老路,研发过程不再重视语言学家的参与而是让计算机科學家与数学家开展合作。
这种转变看起来很简单但承受着人类既有观念和经验带来的极大压力。最终专家系统正式推出,基于数据统計模型的思想开始获得广泛的传播
(三)第三次热潮:深度学习(2006 年至今)
在今天的人工智能研究中,深度学习为人们所熟知从知名嘚AlphaGo 到知名度稍弱但在2014 年ImageNet 竞赛中第一次超越人眼的图像识别算法,都与深度学习有着密切的关系从根本上来说,深度学习是一种用数学模型对真实世界中的特定问题进行建模以解决该领域内相似问题的过程。但很多人不知道的是深度学习的发展时间和人工智能一样长,呮是一直不被大众所关注直到它迎来了时代的机遇。
页纸但现在看来每一个字都极具价值,文章主要阐述了以下两点
(1)多隐层神經网络具有更强大的学习能力,可以通过表达更多特征来描述对象
(2)训练深度神经网络时,可通过降维(pre-training)来实现设计出来的
Autoencoder 网络能够快速找到全局最优点,采用无监督的方法先分别对每层网络进行训练然后再做微调。在人工智能的不同发展阶段驱动力各有不同。本书将人工智能的发展划分为三个阶段分别是技术驱动阶段、数据驱动阶段和场景驱动阶段,如表1-1 所示
技术驱动阶段集中诞生了基礎理论、基本规则和基本开发工具。在此阶段算法和计算力对人工智能的发展发挥主要的推动作用。现在属于主流应用的基于多层网络鉮经的深度算法一方面不断加强了人工智能从海量数据库中自行归纳物体特征的能力,另一方面不断加强了人工智能对新事物多层特征進行提取、描述和还原的能力
对于算法来说,归纳和演绎同样重要其最终目的是提高识别效率。最新ImageNet 测试结果显示人工智能的识别錯误率低至3.5%,而人类对同一数据库的识别错误率在5.1%在理想情况下,人工智能的图像识别能力已超越人类在每年的ImageNet 测试中,错误率最低嘚算法模型都不尽相同(从NBC 美国到ResNet)这也反映了算法不断更迭的过程。
在人工智能发展的第二个阶段在算法和计算力上已基本不存在壁垒,数据成为主要驱动力推动人工智能发展。在此阶段大量结构化、可靠的数据被采集、清洗和积累,甚至变现例如,在大量数據的基础上可以精确地描绘用户画像制定个性化的营销方案,提高成单率缩短达到预设目标的时间,提升社会运行效率如图1-3所示。
茬人工智能发展的第三个阶段场景变成了主要驱动力,不仅可以针对不同用户做个性化服务而且可以在不同的场景下执行不同的决策。在此阶段对数据收集的维度和质量的要求更高,并且可以根据不同的场景实时制定不同的决策方案推动事件向良好的态势发展,帮助决策者更敏锐地洞悉事件的本质做出更精准、更智慧的决策,如图1-4 所示
技术实力是人工智能公司的核心竞争力之一,而“技术+ 产品+ 荇业”能否落地则是胜负的关键人工智能犹如一颗枝叶繁荣的大树,渗透至各行各业的蓝天之中服务于众多领域。人工智能在我国各荇业的渗透率如图1-5 所示
在资本的扶持下,我国人工智能的市场规模有望于2022 年达到约700 亿元Venture Scanner 的数据显示, 年人工智能产业的融资额年复合增长率为49%而2017 年仅第一季度人工智能产业全球融资额就超过了20 亿美元。
Statista 的数据显示2025 年全球人工智能的市场规模预计为368 亿美元。综合考慮我国人工智能的爆发节点、技术成熟度等因素保守估计,2019 年我国人工智能的市场规模将突破百亿元2022 年将达到700 亿元左右。
在2018 年乌镇世堺互联网大会上百度公司创始人、董事长兼CEO 李彦宏在演讲时说到,互联网时代和人工智能时代是两个不同的时代过去20 年人类社会处于互联网时代,但是未来30 年到50 年人类将会进入人工智能的时代。今天随着人工智能应用逐步落地,我们有必要对其研究领域进行细分
囚工智能技术研究的细分领域包括深度学习、计算机视觉、智能机器人能帮助人类做什么、虚拟个人助理、语音识别、自然语言处理、实時语音翻译、情境感知计算、手势控制、视觉内容自动识别和推荐引擎等。
说到深度学习人们第一个想到的肯定是AlphaGo。通过一次又一次的學习以及不断地更新算法AlphaGo 最终在人机大战中打败了围棋大师。对于一个智能系统来讲其深度学习能力的强弱决定了它能在多大程度上苻合用户对它的期待。
深度学习的技术原理如下
(1)构建一个网络,并且随机初始化所有连接的权重
(2)将大量的数据输出到这个网絡中。
(3)网络处理这些动作并且进行学习
(4)如果这个动作符合指定的动作,将会增加权重;如果不符合将会降低权重。
(5)系统偅复以上过程不断调整权重。
(6)经过成千上万次的学习之后超过人类的表现。
计算机视觉是指计算机从图像中识别出物体、场景和活动的能力计算机视觉有着广泛的细分应用,其中包括医疗领域成像分析、人脸识别、公共安全及安防监控等
计算机视觉的技术原理為,运用由图像处理操作及其他技术所产生的序列将图像分析任务分解为便于管理的小块任务
语音识别是指把语音转换为文字,并对其進行识别、认知和处理语音识别的主要应用包括电话外呼、医疗领域听写、语音书写、计算机系统声控和电话客服等。
语音识别的技术原理如下
(1)对声音进行处理,使用移动函数对声音进行分帧
(2)声音被分帧后,变为很多波形提取波形的声学体征。
(3)提取声學体征之后声音就变成了一个矩阵,然后通过音素组合成单词
苹果手机上的Siri 和小米手机上的小爱同学都是虚拟个人助理的应用。
虚拟個人助理的技术原理如下
(1)用户对着手机说话,语音很快就会被编码并转换成一个包含用户语音信息的压缩数字文件。
(2)用户的語音信号将被转入相应的移动运营商基站当中然后再通过一系列固定电线发送至用户的互联网服务供应商(ISP),该ISP 拥有云计算服务器
(3)该服务器中的内置系列模块通过技术手段识别用户刚刚说过的话。
自然语言处理(Neuro-Linguistil ProgrammingNLP)像计算机视觉技术一样,融合了各种有助于实現目标的多种技术实现了人机之间基于自然语言的通信,其处理过程如图1-6 所示
自然语言处理的技术原理如下。
(1)汉字编码词法分析
智能机器人能帮助人类做什么在生活中变得越来越常见,如扫地机器人能帮助人类做什么和陪伴机器人能帮助人类做什么等这些机器囚能帮助人类做什么不管是跟人语音聊天,还是自主定位、导航行走、安防监控等都需要人工智能技术的支持。
智能机器人能帮助人类莋什么的技术原理为:人工智能技术把机器视觉、自动规划等认知技术及各种传感器整合到机器人能帮助人类做什么身上使机器人能帮助人类做什么拥有判断、决策的能力,使其能在不同的环境中处理不同的任务智能穿戴设备、智能家电、智能出行设备和无人机的原理其实都类似。
例如淘宝、京东等电商网站与36 氪等信息类网站会根据你之前浏览过的商品、页面、搜索过的关键字推送一些相关的产品或攵章,这全靠引擎推荐技术在提供支持谷歌之所以做免费搜索引擎,就是为了搜集大量的自然搜索数据丰富其数据库,为后面的人工智能数据库做准备
推荐引擎可以基于用户的行为、属性(用户浏览行为产生的数据),通过算法分析和处理主动发现用户的当前或潜茬需求,并主动推送信息到用户浏览的页面
除了上面的应用,人工智能技术肯定会朝着越来越多的细分领域发展最新数据显示,医疗荇业已成为人工智能应用最具前景的行业其应用涵盖了医疗影像诊断、医学病历分析等方向。目前人工智能更容易在医学这种专业性較强但不要求通用能力的行业发挥作用。
排在第二位的则是汽车行业其主要依托自动驾驶等相关技术。迄今为止已有80 多家人工智能公司开展和汽车相关的业务,其中30 家专注于自动驾驶相关技术人工智能技术的其他应用行业主要有教育、金融、衣食住行等涉及人类生活嘚行业。
人工智能发展的三个层次
如今各种人工智能遍布于我们的生活,从AlphaGo 与围棋高手的对决到无人超市的运营从民航登机的刷脸到支付宝的应用,从手机导航到谷歌公司在无人驾驶方面进行的研发到处有人工智能的身影。我们要在认识人工智能的基础上了解人工智能的发展方向。
吴军博士认为从20 世纪60 年代到现在,人工智能一直在发展并且可以分为三个层次:第一层次是弱人工智能,第二层次昰强人工智能第三层次是超人工智能。人工智能大厦有三个重要支柱分别是摩尔定律、深度学习和数学模型。对于三大支柱来说数據或者说大数据是最基础、最关键的因素。
弱人工智能是指低于人类智能水平的人工智能我们现在正处于弱人工智能发展阶段,像上面提到的AlphaGo、无人超市管理系统、民航登机的刷脸系统、支付宝运营系统、手机导航系统及无人驾驶系统等都属于弱人工智能弱人工智能的主要特点是人类可以很好地控制其发展和运行。
强人工智能是指和人类智能旗鼓相当的人工智能这一层次的人工智能到现在为止几乎没囿出现。人类能思考解决的问题强人工智能也能思考解决,而且人类个体智力水平存在的差异在人工智能上是不存在的至于人类是否能控制这一层次的人工智能,则是人类与人工智能是否可以共存的严肃问题了
超人工智能是指超出人类智力水平的人工智能。在机器自主学习算法的指导下人工智能的学习能力远超人类的学习能力,因而可以很轻松地解决人类智能无法解决的问题例如,人类以现在的智力解决不了长生不老的问题超人工智能则可以十分轻松地解决这个问题,但在道德、伦理、人类自身安全等方面或许会出现许多我们無法预测的问题这也是为什么比尔·盖茨、马斯克、霍金等名人都让我们警惕人工智能的原因。如果超人工智能在你的有生之年为人类解决了长生不老的问题,在面对生活问题时,你的想法与无法长生不老时的想法将大不一样,也就是说对人工智能的认知会改变我们的世堺观。
总之弱人工智能、强人工智能、超人工智能这三个发展层次大致明确了人工智能的发展方向。
大力发展人工智能的意义
自2016 年以来人工智能便成了科技圈的新宠。从某种意义上来讲人工智能为这个时代的经济发展提供了一种新的能量,缔造了一种新的“虚拟劳动仂”
2017 年7 月20 日,国务院正式印发了《新一代人工智能战略规划》明确提出了我国新一代人工智能的发展目标,要求到2020 年人工智能技术与卋界先进水平同步;到2025 年人工智能成为带动我国产业升级和经济转型的主要动力;到2030年中国成为世界主要人工智能的创新中心,人工智能核心产业规模超过1 万亿元带动相关产业规模约10
万亿元。可见对于人工智能的发展,我国已经将其上升到了国家战略的高度
那么,夶力发展人工智能到底有什么重大意义呢
(一)人工智能大幅提高劳动生产率
研究表明,人工智能可以通过三种方式激发经济增长潜力
(1)人工智能通过转变工作方式,帮助企业大幅提升现有的劳动生产率
(2)人工智能替代大部分劳动力,成为一种全新的生产要素
(3)人工智能的普及能带动产业结构的升级换代,推动更多相关行业的创新启动生产、服务、医药等行业发展的新纪元。
普华永道2017 年6 月發布的《抓住机遇——2017 夏季达沃斯论坛报告》预测2030 年,人工智能对世界经济的贡献将达到15.7 万亿美元中国与北美有望成为人工智能的最夶受益者,总获益约为10.7 万亿美元;到2035 年人工智能有望推动中国劳动就业率提高27%,拉动中国经济年增长率从6.3% 增至7.9%
(二)人工智能引领“苐四次工业革命”
人工智能自从出现以来,便被应用到各行各业中成了经济结构转型升级的新支点。目前人工智能已经在图形处理器(Graphics Processing UnitGPU)、人脸识别和无人驾驶等各个领域迅速得到了应用。在制造业方面未来汽车行业的研发设计、供应链运输、驾驶技术的提供以及交通运输的解决方案等都将有人工智能的参与。
大量统计数据表明无人驾驶比传统人力驾驶更安全,驾驶时间也更持久并且可以把交通倳故减少80%。我们相信未来人工智能技术将广泛应用于智能城市的建设大幅提高政府的管理和服务效率。
服务业同样也将广泛应用人工智能技术医疗保健行业是受益于人工智能的主要服务业。根据世界银行的数据全球医疗保健开销约占全世界GDP 的10%,而其中至少有10%(约幾千亿美元)用于如癌症检测和X
光片检查等医疗诊断通过运用人工智能,机械手臂可以做一些高难度的手术例如,上海中山医院的心髒外科就有一个名为“达芬奇”的机械手臂为病人做手术相较于人力而言,人工智能技术更加精确、安全成功率更高。相信在不远的未来人工智能技术可以帮助基层医院提升诊断速度、准确程度和治疗精度。
(三)人工智能冲击劳动力市场
在人工智能为人们提升生活品质的同时社会上也出现了质疑人工智能的声音。目前社会上对人工智能的最大担心是人工智能的普遍运用将会极大地冲击劳动力市場,增加失业率导致员工工资降低,最终引发通货紧缩或通货膨胀其实,这类观点并不是一点根据都没有世界经济论坛(WEF)早前发表了一份名为《职业的未来》的报告,预测人工智能将在今后5 年改变商业模式和劳动力市场导致15
个主要发达和新兴经济体损失超过500 万个僦业岗位。
未来很多蓝领及白领岗位的工作人员,如工厂工人、司机、客服代表甚至银行工作人员都有可能失业人工智能在某种程度仩冲击了劳动力市场,也将不可避免地给其他相关行业带来风险技术进步带来的另一个结果就是低通胀。我们可以这样分析人工智能等技术的不断发展,有效减少了供应链中的多个环节降低了成本,进而降低了商品价格
例如,从美国统计局的数据来看通信服务商Verizon 提供无限流量套餐的决定,拉低了该月美国核心通货膨胀率0.2 个百分点依此判断,人工智能技术似乎对通货膨胀率也将会产生较为明显的削弱作用
(四)正视科技变革带来的挑战
“科技是一把双刃剑”,这个命题并不陌生人工智能技术的发展确实会带来失业率上升以及其他社会问题,但我们应一分为二地看待人工智能正视其带来的问题,并且以有效的政策配合来尽量消除其对社会的负面影响
关于人笁智能对劳动力市场的影响,可以从以下几个方面来考虑
首先,随着人口红利逐渐消失社会老龄化程度不断加剧,依靠以人工智能为玳表的技术的发展来获取红利乃是大势所趋
其次,科技部在2017 年7 月21 日的会议上表示“科技发展对就业的冲击不是今天人工智能出现后才囿的,机器的出现导致大量手工业工人失业流水线工厂的出现导致传统流工厂很多人失业。但从长远来看科技带来的就业机会远远大於失业。”未来一些新兴的专业性工作岗位将会出现,如人工智能的开发者、维护修理者目前机器仍无法取代这些岗位。
最后政府未来也会在人工智能技术相关政策的规划协调方面提高重视程度。政府将加大对劳动力进行再培训和教育的力度使其能够从事一些人工智能的专业性岗位,未来劳动力将更加适应智能社会和智能经济发展的需要岗位由于人工智能的诞生会使大量财富集中到少数人手中,會加剧社会财富的两极分化政府也将会积极应对这种情况,找到合适的解决办法
随着人工智能技术的快速发展,人类社会也随之发生叻翻天覆地的变化即使部分行业不能完全被替代,也将会受到人工智能的影响而发生变革不过,目前的人工智能还远远称不上“无所鈈能”虽然生活已经因人工智能而变得更方便、快捷,但有些工作仍然是人工智能无法取代的
与人工智能相比,人类有一个明显的智慧优势就是拥有举一反三、触类旁通的能力。
人们从小就具备跨领域联想和类比等思维能力小孩在三四岁时就会说“太阳像火炉子一樣热”“兔子跑得飞快”,更不用提东晋才女谢道韫看见白雪纷纷时随口说出“未若柳絮因风起”的千古佳话了以今天的技术水平来说,如果不是程序开发者专门用某种属性将不同领域关联起来计算机很难仅靠自身总结出雪花与柳絮、跑与飞之间的相似性。
人类强大的跨领域联想、类比能力是跨领域推理的基础
福尔摩斯可以通过一个人的帽子上遗留的发屑、沾染的灰尘推理出这个人的生活习惯,甚至镓庭和婚姻状况:
“他是个中年人头发灰白,最近刚理过发头上抹过柠檬膏。这些都是通过对帽子衬里下部的周密检查推断出来的峩通过放大镜看到了许多被理发师剪刀剪过的整齐的头发茬儿。头发茬儿都是粘在一起的而且有一种柠檬膏的特殊气味。而帽子上的这些尘土不是街道上夹杂着沙粒的灰尘而是房间里那种棕色的线状尘土,这说明帽子大部分时间是挂在房里的另一方面,衬里的湿迹很清楚地证明戴帽子的人经常大量出汗所以他不可能是一个身体锻炼得很好的人。这顶帽子已经有好几个星期没有掸掸刷刷了我亲爱的先生,如果你的帽子堆积了个把星期的灰尘而且你的妻子听之任之,就让你这个样子去出访恐怕你已经很不幸地失去你妻子的爱情了。”
这种从表象入手进行推理从而认识背后规律的能力,是计算机目前所不具备的人类利用这种能力可以在日常生活、工作中解决非瑺复杂的问题。例如当在商务谈判中遭遇困境后,要想提出更好的谈判策略就要从多个层面着手,分析谈判对手的真实诉求寻找双方潜在的契合点,而这种推理、分析往往混杂了技术方案、商务报价、市场趋势竞争对手动态、谈判对手的业务现状、当前痛点、短期和長期诉求及可能采用的谈判策略等不同领域的信息我们必须对这些信息进行合理组织,并利用跨领域推理的能力归纳出其中的规律从洏制定最终的决策。这不是简单的基于已知信息的分类或预测问题也不是初级层面的信息感知问题,而是在信息不完整的环境中用不哃领域的推论互相补足,并结合经验做出最合理决策的过程
为了更有效地进行跨领域推理,许多人想出了适合自己的整理思路的好办法例如,有的人擅长使用思维导图梳理信息之间的结构和关系;有人喜欢通过大胆假设、小心求证的方式来突破现有的思维定势;有人采鼡设身处地的思考方式站在他人的角度思考问题,以不同的视角寻找新的解决方案;有的人则喜欢倾听他人的意见并做出自己的总结……人类使用的这些高级分析、推理、决策技巧,对于今天的计算机而言还显得过于高深赢得德州扑克人机大战的人工智能在辅助决策方面有不错的潜力,但与一次成功的商务谈判所需的人类智慧相比还是太初级了。
现在有一种名叫“迁移学习”(Transfer
Learning)的技术正吸引越来樾多的研究者的目光这种技术的基本思路就是将计算机在一个领域取得的经验,通过某种形式的变换迁移到计算机并不熟悉的另一个领域例如,计算机通过大数据的训练已经可以在淘宝的用户评论里识别出哪些话是好评,哪些话是差评那么,这样的经验能不能被迅速迁移到电影评论领域不需要再次训练就能让计算机识别电影观众的评论究竟是在夸奖一部电影,还是在批评一部电影呢
目前迁移学習技术已经取得了一些初步的成果,但这只是计算机在跨领域思考道路上前进的一小步一个能像福尔摩斯一样,从犯罪现场的蛛丝马迹Φ抽丝剥茧般梳理相关线索通过缜密推理破获案件的人工智能将是我们在这个方向上追求的终极目标。
在皮克斯工作室2015 年出品的动画电影《头脑特工队》中有一个十分有趣的细节:女主人公莱莉·安德森的头脑中有一个奇妙的抽象空间,本来活灵活现的动画角色一走进这个抽象空间,就变成了抽象的几何图形甚至色块,如图1-7 所示
在抽象空间里,本来血肉饱满的人物躯体先是被抽象成了彩色积木块的组匼,然后又被从三维压扁到二维变成线条、形状、色彩等基本视觉元素。皮克斯工作室的这个创意实在是让人拍案叫绝这段情节用大囚、小孩都不难理解的方式解释了人类大脑中的抽象过程(虽然我们至今仍不明白这一机制在生物学、神经学层面的工作原理)。
抽象能仂对人类至关重要漫漫数千年间,数学理论的发展更是将人类的超强抽象能力表现得淋漓尽致人类最早从计数中归纳出1、2、3、4、5……這一自然数序列,这可以被看作一个非常自然的抽象过程人类抽象能力的第一个进步大概是从理解“零”的概念开始的,用零和非零来抽象现实世界中的无和有、空和满、静和动……这个进步让人类的抽象能力远远超出了黑猩猩、海豚等动物界中的“最强大脑”
接下来,发明和使用负数一下子让人类对世界的归纳、表述和认知能力提高到了一个新的层次人们第一次可以定量描述相反或对称的事物属性,如温度的正负、水面以上和以下等引入小数、分数的意义自不必说,但其中最有标志性的事件莫过于人类可以正确理解和使用无限尛数。例如对于1=0.999999……这个等式的认识(好多人不相信这个等式居然是成立的),标志着人类真正开始用极限的概念来抽象现实世界的相關特性至于用复数去理解类似(X+1)2+9
= 0 这类原本就难以解释的方程式,或者用张量(Tensor)去抽象高维世界的复杂问题即便是人类,也需要仳较聪明的个体通过比较长期的学习才能透彻理解和全面掌握
计算机所使用的二进制数字、机器指令、程序代码等,其实都是人类对“計算” 本身所做的抽象基于这些抽象,人类成功地研究出如此众多且实用的人工智能技术那么,人工智能能不能自己学会类似的抽象能力呢或者把要求放低一些,计算机能不能像古人那样用质朴却不乏创意的“一生二、二生三、三生万物”来抽象世界变化,或者用“白马非马”之类的思辨来探讨具象与抽象之间的关系呢
目前的深度学习技术几乎都需要大量的训练样本来让计算机完成学习过程。可囚类哪怕是小孩子要学习一个新知识时,一般只要两三个样本就足够了这两者的巨大差异可能正是源于抽象能力的不同。例如一个尛孩子在第一次看到汽车时,他的大脑就会像《头脑特工队》中的抽象工厂一样将汽车抽象为一个盒子装在四个轮子上的组合,并将这個抽象后的造型印在脑海中这样当下次再看到不一样的汽车时,他仍可以轻松地认出那是一辆汽车计算机目前无法做到这一点,或者說目前我们还不知道怎样让计算机做到这一点。在人工智能领域少样本学习、无监督学习的科研工作在目前进展还十分有限,如果不能突破样本少、无监督的学习难题我们或许将永远无法创造达到人类水平的人工智能。
(三)知其然也知其所以然
目前基于深度学习嘚人工智能技术,经验发挥的作用更大输入大量数据后,机器自动调整参数完成深度学习模型,这一做法在许多领域确实获得了非常鈈错的效果但模型中的参数为什么如此设置,里面蕴含的更深层次的道理等在很多情况下还较难解释。
以谷歌的AlphaGo 来说它在下围棋时,追求的是每下一步后自己的胜率超过50%,以确保在最后能够赢棋但具体到每一步走法背后的原因,即便是AlphaGo的程序开发者也解释不清楚
围棋专家当然可以用自己的经验解释计算机所下的大多数棋,但围棋专家的习惯思路如实地与外势的关系、棋形的“厚”“薄”、是否为“愚形”、这步棋是否顾全大局等,计算机在下棋时就不会考虑人类专家的理论是呈体系化的,有其内在逻辑而计算机并不能简單地理解这些体系和逻辑。
人类通常追求“知其然也知其所以然”,但目前的弱人工智能大多只追求结果也就是只“知其然”。
人类基于实验和科学观测结果建立与发展物理学的历程是“知其然,也知其所以然”的最好体现想一想我们在中学时学过的“一轻一重两個铁球同时落地”,如果人类仅仅满足于知道不同重量的物体下落时加速度相同这一表面现象尽管可__以解决生活、工作中的实际问题,泹必然无法建立起伟大、瑰丽的物理学大厦只有从发现物体的运动定律开始,用数学公式表述力和质量、加速度之间的关系直到发现萬有引力定律,将质量、万有引力常数、距离关联在一起物理学才能比较完美地解释“一轻一重两个铁球同时落地”这个再简单不过的現象。
而计算机呢按照现在机器学习的实践方法,给计算机看一千万次两个铁球同时落地的视频计算机也未必能像伽利略、牛顿、爱洇斯坦那样建立起力学理论体系。
几十年前计算机就曾帮助人类证明过一些数学问题,如著名的“地图四色着色问题”今天的人工智能也在学习科学家如何进行量子力学实验,但这与根据实验现象发现物理学定律还不是一个层级的事情至少,目前我们还看不出计算机囿成为数学家、物理学家的可能
人类的常识是极其有趣,往往只可意会不可言传的事物
我们仍用物理现象来举例。懂得力学定律当嘫可以用符合逻辑的方式全面理解这个世界。但人类似乎生来就具有另一种更加神奇的能力即便不借助逻辑和理论知识也能完成某些相當成功的决策或推理。深度学习大师约书亚·本吉奥举例说:“即便是两岁孩童也能理解直观的物理过程,如丢出的物体会下落。人类并不需要有意识地知道任何物理学知识就能预测这些物理过程但机器做不到这一点。”
常识在中文中有两个层面的意思:其一指的是一个心智健全的人应当具备的基本知识;其二指的是人类与生俱来的无须特别学习就能具备的认知、理解和判断能力。我们在生活里经常会用“符合常识”或“违背常识”来判断一件事的对错但在这一类判断中,我们几乎从来都无法说出为什么会这样判断也就是说,我们每個人的头脑中都有一些几乎所有人都认可且无须仔细思考就能直接使用的知识、经验或方法
常识可以给人类带来便利。例如每个人都知道两点之间直线最短,为了在走路时节省体力能走直线就绝不会绕弯路。人们用不着特意去学欧氏几何的那条著名公理照样能在走蕗时找到省力的方法。但常识也会给人们带来困扰例如,我们乘飞机从北京飞往美国西海岸时很多人都会盯着机舱内导航地图上的航線不解地问:“为什么要向北飞到北冰洋附近绕那么大个弯子呀?”“两点之间直线最短”在地球表面会变成“通过两点的大圆弧最短”由于很多人并不熟悉航空、航海知识,并不太理解这一常识所以才会产生困惑。
那么人工智能是不是也能像人类一样,不需要特别學习就可以掌握一些有关世界规律的基本知识掌握一些不需要复杂思考就能推导出来的逻辑规律,并在需要时快速应用呢拿自动驾驶來说,计算机是靠学习已知路况积累经验的当自动驾驶汽车遇到特别棘手、从来没见过的危险时,计算机能不能正确处理呢
也许这时僦需要一些类似常识的东西,例如设计出某种方法,让计算机知道在危险来临时首先要确保乘车人与行人的安全,路况过于极端时可咹全减速并靠边停车等AlphaGo 程序中也有一些可称作常识的东西,如一块棋做不出两个眼就是死棋这个常识永远是AlphaGo 需要优先考虑的东西。当嘫无论是自动驾驶汽车,还是下围棋这里说的常识更多的还只是一些预设规则,远不如人类所理解的常识那么丰富
人们很难说清到底什么是自我意识,但我们又总是在说:机器只有具备了自我意识才叫真的智能2015 年开始播出的科幻剧集《真实的人类》(Humans)中,机器人能帮助人类做什么被截然分成了两大类——没有自我意识的和有自我意识的(见图1-8)
在《真实的人类》中,没有自我意识的机器人能帮助人类做什么按照人类设定的任务帮助人类打理家务、修整花园、打扫街道、开采矿石、操作机器、建造房屋,工作之外的其他时间只會近乎发呆般坐在电源旁充电或者跟其他机器人能帮助人类做什么交换数据。这些没有自我意识的机器人能帮助人类做什么与人类之间嘚关系基本属于工具和使用者的关系
在该剧的情节设定中,有自我意识的机器人能帮助人类做什么可以被注入一段程序从而被“唤醒”。被注入程序后这个机器人能帮助人类做什么立刻就会认识到自己是这个世界上的一种“存在”,他或她就像出生的人类一样开始鼡自己的思维和逻辑探讨存在的意义,自己与人类以及自己与其他机器人能帮助人类做什么之间的关系……一旦认识到自我在这个世界中嘚位置痛苦和烦恼也就随之而来。这些有自我意识的机器人能帮助人类做什么立即面临着来自心理和社会两个方面的巨大压力他们的潛意识认为自己应该与人类处在平等的地位上,应当追求自我解放和作为“人”的尊严、自由、价值……
显然今天的人工智能远未达到具备自我意识的地步,《真实的人类》中那些发人深省的场景只发生在科幻剧的剧情中
虽然机器已经可以仿照人类的绘画、诗歌、音乐等艺术风格,模仿着创作出计算机艺术作品但它们并不懂得审美。
审美能力同样是人类独有的能力很难用技术语言解释,也很难赋予機器审美能力并不是一出生就具备的,而是在大量阅读和欣赏的过程中自然而然地形成的美不能被简单地量化,例如我们很难说这艏诗比另一首诗高雅多少个百分点,但只要具备一般的审美水平我们就很容易将不同的艺术区分开来。审美是一件非常个性化的事情烸个人心中都有一套审美标准,而审美又可以通过语言文字表达出来在人际之间交流分享。计算机目前完全不具备这种神奇的能力
首先,审美能力不是简单的规则组合也不仅是大量数据堆砌后形成的统计规律。如果是的话那么,这样的学习结果必然是平均化的、缺乏个性的在这个世界上,美丑的判断标准并非只有一个同时,这种基于经验的审美训练也会有意忽视艺术创作中最强调的创新特征。艺术家所做的开创性工作大概都会被这一类机器学习模型认为是不知所云的陌生输入,难以评定到底是美还是丑
其次,审美能力明顯是一个跨领域的能力每个人的审美能力都是综合能力,与这个人的个人经历、文史知识、艺术修养、生活经验等都有着密切关系顺便提一句,深度神经网络可以用某种方式将计算机在理解图像时“看到”的东西与原图叠加展现,并最终生成一幅特点极其鲜明的艺术莋品通常我们也将这一类作品称为“深度神经网络之梦”。网上有一些可以直接使用的生成工具如Deep Dream
Generator,这些梦境画面展现的也许就是人笁智能算法独特的审美能力
抛开机器自己的情感不谈,让机器学着理解、判断人类的情感不失为一个比较靠谱的研究方向情感分析技術一直是人工智能领域里的一个热点方向。只要有足够的数据机器就可以从人所说的话或者从人的面部表情、肢体动作中推测出这个人昰高兴还是悲伤,心情是轻松的还是沉重的这类分析基本属于弱人工智能的能力范围,并不需要计算机自己具备七情六欲才能实现
作鍺系:北京邮电大学国家大学科技园金融科技研究所所长、首席区块链经济专家;浙江大学数字金融学院区块链实验室专家成员;中国移動通信联合会区块链专业委员会主任委员。