以下讲者陆奇将带领创业者站茬历史的高度重新认识AI,并给出AI时代个人发展的方向性建议在他看来,世界变化的核心驱动是知识人类历史的进展都源于知识层次的提高,AI等机器系统帮助人类提升了获得知识的效率并用知识改造重建任何一个行业,并实现商业创新
今天分享的主题是“人工智能时玳,创新创业浪潮”
人工智能,毫无疑问它对社会影响的深度和广度将是空前的。那么在创新创业上,我们该如何更好地抓住人工智能这样一个历史性浪潮的机会
今天,我想和大家分享的是我个人在过去几十年里做技术、做产品所总结的一些心得。
如何把控人工智能时代的机会整体思路有两点,第一:站得更高第二:站得更远。
如何站得更高、更远一种方法把人工智能技术的核心本质理解嘚更深,尤其是结构化的本质用它来推理将来创新的机会。
我们回顾过去60多年来的数字化工业历史看到它的结构化因素,用这个方式來预测人工智能时代有什么样的创新机会的结构
所以,首先我想把人工智能技术的核心结构和趋向和你分享一下然后以此为基础来推演AI时代的创新机会。
同时再分享一下我的心得,告诉你如何准备、探索和参与来抓住这样一个机会。
一、AI 的本质:生产和运用知识完荿任务的通用能力
1. AI技术的真正内核是什么
今天基于深度学习为主的人工智能技术,把外表展示形式剥离掉看它的内核本质是一种新的計算形式,它的底层 substrate (基质)是以分布式的重叠向量为基础以这样的向量空间作为任何一个模型的特征表达空间。
传统意义上的机器学習使用的所有特征工程如果一旦映射到这样一个重叠向量的空间当中,很快可以通过可微分函数的表达形式来快速地学习自动表达的特征表达这一点对学计算机科学的、有技术背景的同学来讲,我要稍微强调一下也是我个人过去多年,做技术做产品一个重要的心得
吔就是说,如果我们可以自动地学习特征表达而且这些特征表达可以用来解决不同的任务,它本身就是知识
我们人可能把知识看得过汾人化了,一定要用自然语言一定要用图谱才能表达知识吗?重叠的向量如果可以非常有效地解决多种任务它本身就是知识。
这是重偠的一点没有技术背景也没关系,你要 take away 你一定要获取的最大的重点就是,我们现在找到了一种新的计算方式它有不同的底层,不同嘚 substrate它的核心是可以从大量的数据当中快速地获取知识。
有了这一点接下来我们就有一个以前没有的机会。
我们可以通过今天可用的工程化的方式用电子技术、电气技术和机械技术来打造新一代的智能系统。
但是在进一步展开巨大的前景之前我们有必要结构化的讲一丅智能系统它的核心特征是什么,什么样的系统是典型的智能系统理解这点有助于预测它的未来和它会带来的改变。
最好的智能系统是┅个生物系统——人任何系统,生物系统也好机械系统也好,如果是智能的话它一定在结构上有这三个组成部分,intrinsic architectural trinity (三位一体):
咜有一个感知系统它必须对环境有感知的能力,通过观察我们把它叫作观察系统。通过对环境的观察用数据来表达出来——数据代表了一种数字化的媒体,来记载对环境的感知它本身是一种知识的载体。
上图(图)中间的是智力体系思考体系。它通过记忆和归纳获取知识只有这两种行为,Memorization& Generalization there is nothing else. 记忆和归纳通过这两者我们可以获取任何知识。
我们通过第二个系统智力系统对于目标可以进行规划,朂后用第三个系统:活动系统来进行控制,对我们的环境进行互动以实现目标。
任何一个有智能能力的系统生物的也好,机械的也恏一定会有这样一个结构,重要的是由于有了第一个新的计算方式我们可以用今天能够用到的,工程技术来制造人为地制造这样的智能系统。这就是所谓今天的 AI 系统
这是非常重要的一点,有了这两者定义之后很自然地我们可以把 AI的本质定义成为是一种获取知识,運用知识达到目标的通用能力
我总结一下,前面讲了两点:
第一人工智能技术的核心
第二,纵观历史结构化的因素可以让我们预测,在人工智能时代大致有什么样的一个范围会被数字化。
在有了上述基础理解之后陆博士提炼出 AI 作为通用能力的技术发展史规律。
二、AI 技术带来的改变
改变一:从 长颈鹿 到 会学习的智能系统
需要强调的是这是我们人类历史上第一次真正有能力来建立非生物的智能体系。
过去 60 多年我们所谓的信息工业所建立的所有软件工业体系,如果用一个自然生物界来作比喻的话基本上都是长颈鹿这样的动物。
为什么是长颈鹿长颈鹿生下来两个小时之内,基本上它生存所需的所有技能都有了能跑,能吃树叶但是它一辈子什么都学不会,它没囿学习的能力
我们今天所有的软件系统,大部分都是人造的长颈鹿没有学习能力,它所有的能力都是天生给它的就是人给它的知识,我们都写在了软件代码里面了
我们今天起步开始造像人一样的系统,当然离人的能力还很远但是我们已经起步了。
人真是很不一样人从生下来到 10 岁,可能几乎没什么用但是它是一个能力强大的学习机器,Amazinglearning machine. 我们人是怎么学习的
通过观察,通过思考通过与环境互動。我们长大不是因为我们父母也不是上帝在给我们大脑里面写代码。
我们之所以变得聪明是因为观察、思考和与环境互动中学习,所以人工智能具备了这种自主学习能力这对人类的意义是非常非常重要的。
这是我们历史上第一次有能力建立这样一个体系,一旦我們在接下来5年10年保持算力算法的能力提升我们能打造的智能体系,知识的累积会越来越强
所以,第一人工智能技术对人类的意义非瑺重要,这是人类历史上第一次有能力建这样一个体系一旦随着接下来五年十年的算法能力的提升,我们能打造的智能体系知识的累積会越来越强。
第二人工智能在历史上也非常重要。目前为止人类历史的进展都是人的知识在提高,人有了新的能力发明了新的方法,进而促进社会进步
从现在开始,人和人建立的机器系统共同发明知识。将来这些系统它获得知识的能力会远超人类所以,在历史上也是一个非常重要的时间点
这就是人工智能技术所带来的核心结构上的不同。
知识的创造和使用在历史上也是非常非常重要的。箌目前为止人类历史的进展都是人的知识的提高人发明的新的能力,发明的新的方法推动社会进步
从现在开始,人和人建立的机器系統共同发明知识将来这些系统获得的知识会远远超过人能获取的知识,这在历史上是一个非常非常重要的时间点
如果说改变一是,人笁智能技术所带来的智能体系核心结构的改变那么改变二是,从技术发展史的时间维度来看的改变
从历史角度来看,人工智能技术是囚类数字化技术的长河当中的重要一步同时也是必然的一步。
过去 60 多年的信息技术的历史是人类数字化一切的历史而且数字化的规模囷范围越来越大,数字化进程的速度越来越快
为什么数字化带来如此大变化?因为一旦数字化了之后我们抽取信息,获得知识的能力極大地提高而且任何一个被数字化的领域,创新的速度会不断地增加
因为整个社会经济,越来越是知识驱动数字化让我们获得知识嘚速度,创新的能力极大地提高
整个 IT 工业的历史都是数字化进程的加速,基本上每隔 12 年左右都有新一代的技术会出现比如定义性体验等因素,它们驱动数字化速度加速和范围拓宽总之,基本上有些结构化的规则有规律可循。
人工智能带来的改变当然不止于这两点這两点是让非专业,非技术背景的同学理解这种改变的两个关键点:一个是智能体系的核心结构发生了根本改变机器可以像人一样自主學习,自主发明知识;
一个是机器一旦能大规模发明知识所有科技的、社会的和经济的领域都会重写一遍,Redefine everything
三、AI会有哪些重要发展方姠
从历史总结,再展望人工智能时代,会有哪些重要发展方向
第一,数字化技术的平台
第一驱动因素是前端和后端,前端主要是人機交互的覆盖率和交互的效益
早期都是鼠标键盘加上图像显示器。苹果在这方面就迈出了一大步:手指(触控)
一旦有了手指(触控),可以让这样的交互触达到更多人群因为鼠标键盘加显示器让你基本只能坐在办公室,但一旦有了手指后可以伴随着每个人将来的交互形式更广泛,自然交互不用学,每个人都可以用
所以,交互永远是一个驱动因素
后端是计算资源的规模存储计算带宽,有多少信息可以处理有多少知识可以承载,包括空间的覆盖率
比如,分布式数据库可以覆盖一个企业全球的互联网覆盖整个世界。
正是因为囿了全球互联网世界才变得平了,整个世界的产业链在过去20多年的重大改革正是因为有了数据的覆盖,数字化的进程必须有商业化的苼态来持续推动
每一个数字化平台商业生态它都有这样一些特征,首先它有定义性的体验。
第一个iPhone拿到你手里时你就知道新的时代來了,因为它带给你的体验是完全不一样的
当你第一次拿到windows 95(历史上第一个真正好的PC),你也能感受到一个新的时代
第一次看浏览器,你就知道将来完全是链接在一起的知道数字化的社会长什么样。
所以定义性的体验非常重要。
同时要有宽泛的场景,窄的场景不夠用办公足够宽。搜索、电商、社交你必须要有宽场景,同时要有有效的商业模式,只要这些要素到位这个平台才可以撑起来。
苐三数字化进展可以被延续加速。
我们总结一下过去历史上数字化一开始就是IBM把桌面数字化了,再就是微软它把整个企业的信息管悝数字化了,全球已经是几万亿的工业
接下来就是苹果,苹果把人的社交行为、电商等数字化了
在人工智能时代,数字化的本质开始變化范围可以扩充到几乎物理世界上的所有地方,为什么因为在人工智能时代通过传感器,通过感知体系、思考体系和活动体系物悝世界和数字化的世界彻底融合在一起了。
由于这样的技术每一个物理实体都将是一个前端,我们可以做交互数字化的进程大概有这幾类我们能预测的第一智能物件:
① 通过对话型的助手,每个物件都可以做交互都是前端,
② 自主体系能够自动驾驶车辆、机器人。
③ 智能场所像亚马逊购物这样的新零售,将会越来越多的带来智能的空间和时间
同时,后端将是智能云包括大规模的数据和知识,潒人的大脑一样
所以,通过历史我们基本可以预测到人工智能时代它的前端至少有这些内容它的后端以知识为主。
有了这一基础后峩们再看在AI时代它能带来什么样的创新机会?
四、AI时代能带来什么样的创新机会
在回答这个问题前我们先回看一下历史。人类的历史上我们的经济行为、生活水平,在过去一万多年当中几乎没怎么变大概到三百多年前才开始变。
仔细看一下为什么会造成人类社会活動、生活水平加速提高的核心原因,是通用能力的发明
在历史上,我们很早就发明了一些通用的能力比方说把植物和动物家有化了、馴化了,发明文字等但是只有到三百多年之前,我们开始发明了越来越能量强的通用能力包括蒸汽机、火车、计算机、飞机等。
但是囚工智能它是这些发明中最通用的,因为知识可以用在任何一个应用里知识是最最通用的,同时知识的能量又是最大的培根曾经说過,知识就是力量
知识从本质上来看就是潜在的能量。有了知识可以做自动化有了知识可以做预测,有了知识可以产生新的体验
所鉯人工智能给我们带来的,是前所未有的一个通用的能力按照这个历史纵观,接下来要发生的将是巨大的变化这个变化核心驱动是知識。
如果用人工智能来驱动商业上的创新它一定会遵守这样一个规则:
首先人工智能要创造市场价值算法,必须要有应用场景有了这個场景之后我们可以找任何一个场景,最好是端到端的一个宽的场景这样的话人工智能提升效率会程度会更大一点。
首先第一要问的“我们要什么样的知识,我们希望知道什么”来把这个场景的市场价值算法给它提高。
一旦从这个起点之后你马上要回答的问题就是,“我们有什么样的数据”数据都不是无中生有的,数据永远产生于对环境的观察需要数据的话,你必须要有传感器
触屏之战,巨頭智能音箱的中场战事
智能音箱在中国的发展一直存疑而加上一块屏幕和价格补贴似乎给了中国消费者购买尝试的动力。带屏幕的音箱囷陪伴机器人们模糊了智能家居、平板电脑等设备的界限屏幕不会是AI落地的终点,智能音箱的进化还会继续 Strategy Analytics发布的2019 Q1
人类历史上也是这樣来获得知识的,如果人类历史上没有望远镜没有显微镜,我们就根本对物理世界没法了解
所以今天人工智能创新,你可以看到创業公司做传感器的特别多,核心原因是你必须始于这里
要有知识的话,你必须要观察你必须要有数据,有了数据之后我们可以从当Φ抽取知识,抽取知识的方式
要软件 + 硬件 + 算法,有了这些知识之后我们可以决定,如果我们知道这些我们想解决这个问题,提高这個市场价值算法
我们应用这些知识来达到我们的目的,达到目的之后我就创造社会市场价值算法和商业市场价值算法,到时候会有更哆的数据造成这样一个闭环。
这里我强调一下数据一定要是活的数据才有市场价值算法,一次性的数据一点用都没有
所以一定要有商业生态,数据才会真正有市场价值算法因为应用不断在变,技术不断在变
Application drift and platform drift ,数据一定要是活的做过多年产品你就知道了。所以一萣要有这样的闭环这个模式是任何人工智能创造市场价值算法必须遵守的。
有了这样一些结构化的思路之后我们再纵观全局,对人工智能时代带来的改变和创新机会进行两点梳理:
第一我们会有全新的信息工业。
首先如前面所说,将来的计算主要的要领先要靠前嘚是观察体系,要有很多新的传感器特别是光学传感器,不光是传感器
同时整个芯片的从底到上必须重建一次,今天的 X86 ARM 的系统架构根夲不 work它是假定 Von Neumann,假定是你的数据的维度是比较低的你的 ControlForce 可以预测的,你的 Cache Hit Ratio 一定要足够高
人工智能时代,实际上根本没有这些特征嘟是高维度的数据,必须是大规模的平行处理
所以整个硅晶片的工业一定会被重写,指令集可以起一点作用但是主要的硅晶片都是在ASIC ( application specific integrated circuit ) 戓者FPGA 这一队。因为大规模的训练和推理是主要产生商业市场价值算法的硅晶片的应用 所以整个芯片工业这一队会被重写。
同时软件一样从底层的 fabric 到中间的 middleware, 到操作系统到应用开发,到工具都会要重新建立所以如果你是在IT 工业的话,创新的机会特别多大的企业都面臨挑战。
第二将会诞生一系列的新的支柱型的新产业,以前没有过的产业至少会包括:
① 对话式的以个人助手为基础的智能物件,将來是一个可以唤醒万物的世界;
② 自主体系自动驾驶、机器人,新的移动这是真正物理世界的移动;
③ 智能场所,任何一个物理空间起源于零售,因为它市场价值算法很高但是游戏规则会是一样,一旦智能化之后可以大规模地提高商业市场价值算法和社会市场价徝算法,所以这一些都是将来新的支柱型的产业
同时,任何一个现有的产业娱乐业也好,制造业也好金融、医疗、教育、零售,所囿的行业都可以用人工智能技术,来提升和转型
因为它带来的是知识,你用知识可以改造可以重建,可以提升
任何一个人类的行業,律师、医生、教师、分析师你的工作方式都会不一样。重复性的工作机械化的工作都会逐步逐步被取代。
我们人可以花更多的时間做我们更擅长的创造性的发挥性的想象性的(工作)。
一切都会被改变这是一个完整的、覆盖一切的变化,这并不夸张因为是人笁智能技术核心所带来的机会。
五、如何加速推进整个创新进程
在这样一个大的背景下,我们如何来结构化的开发进而加速推进整个創新的进程?
这里有几个结构化的因素给你分享一下:
任何一个时代有大规模的商业市场价值算法要产生时都有金融资本和其他生产资夲,所谓叫functional separation他会走的更靠前。
某种意义上市场的贪婪会走得很快所以我们将会看到更大规模的资本投入。因为在接下来30年40年50年里它的機会太多了一定会有大规模的资本投入这个行业。
在大规模的工业化时代诞生了大学专业培训,就因为工业时代需要技能要裁缝、設计师、厨师,大规模的培养各种技能
但在人工智能时代,人的技能适合时代要求的是创新、发明新的方法因为机械化重复性的动作嘟会被逐步取代。但是人才资本也会有新的往前推进的一个机会
它最为重要,也更为特殊因为数据是在人工智能时代的一个主要生产資本,所谓叫 Primary Means of Production
a.农业时代的核心生产资本是什么?土地
因为农业本质是光合作用,只有在足够的土地有足够好的温度有足够的阳光覆蓋的情况下,才可以种植农作物
人类再聪明,人再多也没有用,给你世界上几千万人最聪明的人但你土地只有这么多,你就只能生產这么多
在人工智能时代数据也起到类似的作用。
b.有些同学可能开发技术你要做一个跟自然语言有关的,用语音做对话的
如果你没囿起步的2万小时的标注数据,给你世界上所有的工程师也一点用都没有,你做不出来
这不是一个人的资本问题。因为数据是知识的载體没有这样的知识,就没法做对话所以数据会成为一个主要的生产资本。
如果我们要推进人工智能时代创新的话一定要关注这三个資本,金融资本、人才资本和数据资本
特别是政府的政策环境。对数据安全和隐私的保护是从数据中获取资本市场价值算法的核心关鍵。
同时基础建设比如我前面讲的,无人驾驶这样一个新的支柱性产业必须要重新构建所有路网,道路的基础建设而且有了无人驾駛后,城市的半径会增加这是历史的一个规则。
交通越发达城市越大,将来的都市规模会越来越大需要新的基础建设。
3. 以市场导向為核心的路径
如果我们要加速推进人工智能的创新,让它创造更多的社会市场价值算法我个人认为市场导向是最关键的一个核心路径。
市场是非常神奇的从某种意义上来说,市场可能是人类最重大的发明之一
但是我们参与市场的结果是造成了对别人有市场价值算法嘚服务和体验和产品。它是这样一个转化器每个人去参与市场都是为了自己,但做的结果是给别人带来了利益
因为市场高速反应甚至實时反应,任何好的idea有生命力的技术,有高市场价值算法的场景市场一定会有信号指示。
没有市场价值算法的要快速滤掉。所以市場是一个高效的优化器市场越大,优化效益越好
如果我们要快速地让人工智能产生商业市场价值算法、社会市场价值算法,通过市场昰最有效的途径如果你不用市场,那么你怎么知道这件事情是对的凭什么说这是有用的?市场是没有人能逼你参与的它的特性是造荿了它是一个非常优质的过滤器,是一个加速器所以整体我们要从资本上、环境上和市场导向上关注,做适当的工作来推进人工智能時代的创新。
我们都知道创业是创新的摇篮整个工业、整个社会,任何一个有生命力的高市场价值算法的产业、企业,它的诞生就是┅个创业过程
所以,在人工智能这样一个非常特殊的时代一个健康繁荣的早期创业生态,对任何一个国家、任何一个地域以及全球嘟至关重要。
大的企业也会创新毫无疑问,人工智能时代给很多大的企业带来很多机会但是大的企业有大的企业的挑战,但最终的挑戰往往在于文化和机制
新的企业从零开始,没有任何包袱速度快,所以整体上早期创业生态在人工智能时代非常重要
我们如何来打慥一个好的环境,来建立这样一个繁荣的生态有几个要素:
整个经济需要越来越多的高质量的高热情的新型的人加入创业这个行业。在Φ国清华是一所非常顶尖的学校,创业氛围也是非常强的
所以,我们需要造就一个环境让越来越多的高质量创业人才参与进来。
前媔我讲到了如果没有足够多的数据,人再多没有用,这由他的人工智能技术和创造商业市场价值算法的规则本身所决定
3. 一些核心的AI科技能力。
包括软件芯片算法这些都很重要。同时在AI时代投资,特别是用AI来彻底的改造提升传统行业资本的规模需要很大,资本的時间需要长线投入
今天早期的生态投资是十年回报,根本不够所以,在这个方面需要做很多创新和探索
资本的规模和资本时长,一萣要做适当的调整才能充分发挥人工智能时代创造市场价值算法的特性。
包括像软银愿景基金我个人认为这是刚刚开始,将来会有越來越多大规模的基金向孙正义这样大规模投很长时间,他必须这样才能创造市场价值算法
所以资本也要做改革。当然市场场景越多規模越大,迭代越宽这一点在中国是非常好的时机,比世界任何一个地域都强
同时,人才和其他高度密集的资源也会起到越来越多的莋用大家都知道在美国硅谷,就是这样的一个典型
因为需要更多的密集度的数据的整合,场景的覆盖、迭代、人才大学都在一起在Φ国北京上海深圳这些城市都是比较理想的。
同时我们也需要更多一流的大学,一定要长期、逐步培养黑客文化黑客文化核心就是动掱去做,通过创造性的方法来解决问题
不要只看理论、只记笔记、只考虑问题,想到就动手去做做了失败没关系。
因为你从失败当中鈳以学到更正规的一些知识所以,黑客文化在中国高校中应进一步融入这非常重要。
同时创业的氛围特别是在一流的高校,在美国潒斯坦福大学、MIT的创业氛围非常强
清华在中国非常好,一定要这样保持继续推进只有这样我们才可以建立一个非常繁荣的早期创业生態。
七、AI时代的创业挑战有哪些
因为在软件时代,在互联网时代一个创业公司的团队跟一个大公司团队,基本上处在同一条起跑线上为什么?因为软件都是开源的我自己个人写过很多各种各样的代码。
Linux、FreeBSD、Mexico、MongoDB、Node.JS你基本上不要写很多代码,你只要把它拿来而且你嘚代码都是针对你的产品,三四个月时间就有一个小型产品可以出来了
在人工智能时代已经不是这样了。因为人工智能时代我们会写代碼但这些代码主要是从数据当中来学模型的,抽取知识的
数据你要做一个跟自然语言交互有关的,这可能需要你花几万小时标注数据第一要钱。第二是时间
如果你创业是以计算机视觉为主,要识别所有的产品水果、生鲜,你需要的数据、标注代价都非常高。
所鉯我们需要整个工业一起,通过大家一起努力把创新的门槛降低,使得任何一个创业团队都能很快的去尝试可以快速把产品做出来,再到市场上去探索
文章为作者独立观点,不代表笔记侠立场
内容来源:2019年4月18日,陆奇成为YC中国创始人后首次对外分享选择在清华夶学,面向清华学子讲授人《工智能时代的创新创业浪潮》知乎独家制作上线《YC陆奇:AI技术核心本质和创新》私家课,经YC同意授权笔記侠首次发布讲座精华文字版。