陆奇清华演讲：AI 的本质及发展方向

打不死的小强

6年前

内容来源：2019年4月18日，陆奇成为YC中国创始人后首次对外分享，选择在清华大学，面向清华学子讲授《人工智能时代的创新创业浪潮》，知乎独家制作上线《YC陆奇：AI技术核心本质和创新》私家课，经YC同意，授权笔记侠首次发布讲座精华文字版。

陆奇：陆奇先生于2018年8月正式加入Y Combinator (以下简称YC)，担任YC中国创始人及首席执行官，并任YC全球研究院院长，全面负责YC在中国市场的业务和战略拓展。YC 中国2019秋季创业营现已全面开启招募。

讲者 | 陆奇

封面设计 & 责编 | 丽丽

来源 | 笔记侠（ID：Notesman）

编者：

2019年4月18日，陆奇博士在清华的非公开演讲视频《AI的本质与创业创新》独家上线知乎，这也是陆奇首次在中国系统化地输出自己对AI产业的洞察和实战经验。陆奇在讲座中带领创业者站在历史的高度重新认识AI，并给出AI时代个人发展的方向性建议。

在他看来，世界变化的核心驱动是知识，人类历史的进展都源于知识层次的提高，AI等机器系统帮助人类提升了获得知识的效率，并用知识改造重建任何一个行业，并实现商业创新。

以下，enjoy~

今天分享的主题是“人工智能时代，创新创业浪潮”。

人工智能，毫无疑问，它对社会影响的深度和广度将是空前的。那么，在创新创业上，我们该如何更好地抓住人工智能这样一个历史性浪潮的机会？

今天，我想和大家分享的是我个人在过去几十年里，做技术、做产品所总结的一些心得。

如何把控人工智能时代的机会？整体思路有两点，第一：站得更高，第二：站得更远。

如何站得更高、更远？一种方法把人工智能技术的核心本质理解得更深，尤其是结构化的本质，用它来推理将来创新的机会。

我们回顾过去60多年来的数字化工业历史，看到它的结构化因素，用这个方式来预测人工智能时代有什么样的创新机会的结构。

所以，首先我想把人工智能技术的核心结构和趋向和你分享一下，然后以此为基础来推演AI时代的创新机会。

同时，再分享一下我的心得，告诉你如何准备、探索和参与，来抓住这样一个机会。

AI 的本质：生产和运用知识完成任务的通用能力

1. AI技术的真正内核是什么？

今天基于深度学习为主的人工智能技术，把外表展示形式剥离掉看它的内核，本质是一种新的计算形式，它的底层 substrate （基质）是以分布式的重叠向量为基础，以这样的向量空间作为任何一个模型的特征表达空间。

传统意义上的机器学习使用的所有特征工程，如果一旦映射到这样一个重叠向量的空间当中，很快可以通过可微分函数的表达形式来快速地学习自动表达的特征表达。

这一点对学计算机科学的、有技术背景的同学来讲，我要稍微强调一下，也是我个人过去多年，做技术做产品一个重要的心得。

也就是说，如果我们可以自动地学习特征表达，而且这些特征表达可以用来解决不同的任务，它本身就是知识。

我们人可能把知识看得过分人化了，一定要用自然语言，一定要用图谱才能表达知识吗？重叠的向量如果可以非常有效地解决多种任务，它本身就是知识。

这是重要的一点。没有技术背景也没关系，你要 take away ，你一定要获取的最大的重点就是，我们现在找到了一种新的计算方式，它有不同的底层，不同的 substrate，它的核心是可以从大量的数据当中快速地获取知识。

有了这一点，接下来我们就有一个以前没有的机会。

我们可以通过今天可用的工程化的方式，用电子技术、电气技术和机械技术来打造新一代的智能系统。

但是在进一步展开巨大的前景之前，我们有必要结构化的讲一下智能系统它的核心特征是什么，什么样的系统是典型的智能系统，理解这点有助于预测它的未来和它会带来的改变。

2.智能系统的结构

最好的智能系统是一个生物系统——人，任何系统，生物系统也好，机械系统也好，如果是智能的话，它一定在结构上有这三个组成部分，intrinsic architectural trinity （三位一体）：

① 感知系统

它有一个感知系统，它必须对环境有感知的能力，通过观察，我们把它叫作观察系统。通过对环境的观察，用数据来表达出来——数据代表了一种数字化的媒体，来记载对环境的感知。它本身是一种知识的载体。

② 智力系统

上图（图）中间的是智力体系，思考体系。它通过记忆和归纳，获取知识只有这两种行为，Memorization& Generalization there is nothing else. 记忆和归纳，通过这两者我们可以获取任何知识。

③ 活动系统

我们通过第二个系统智力系统，对于目标可以进行规划，最后用第三个系统：活动系统，来进行控制，对我们的环境进行互动，以实现目标。

任何一个有智能能力的系统，生物的也好，机械的也好，一定会有这样一个结构，重要的是由于有了第一个新的计算方式，我们可以用今天能够用到的，工程技术来制造，人为地制造这样的智能系统。这就是所谓今天的 AI 系统。

这是非常重要的一点，有了这两者定义之后，很自然地我们可以把 AI的本质定义成为是一种获取知识，运用知识达到目标的通用能力。

我总结一下，前面讲了两点：

第一，人工智能技术的核心

第二，纵观历史，结构化的因素可以让我们预测，在人工智能时代大致有什么样的一个范围，会被数字化。

在有了上述基础理解之后，陆博士提炼出 AI 作为通用能力的技术发展史规律。

AI 技术带来的改变

改变一：从长颈鹿到会学习的智能系统

需要强调的是，这是我们人类历史上第一次真正有能力来建立非生物的智能体系。

过去 60 多年我们所谓的信息工业，所建立的所有软件工业体系，如果用一个自然生物界来作比喻的话，基本上都是长颈鹿这样的动物。

为什么是长颈鹿？长颈鹿生下来两个小时之内，基本上它生存所需的所有技能都有了，能跑，能吃树叶，但是它一辈子什么都学不会，它没有学习的能力。

我们今天所有的软件系统，大部分都是人造的长颈鹿，没有学习能力，它所有的能力都是天生给它的，就是人给它的知识，我们都写在了软件代码里面了。

我们今天起步开始造像人一样的系统，当然离人的能力还很远，但是我们已经起步了。

人真是很不一样，人从生下来到 10 岁，可能几乎没什么用，但是它是一个能力强大的学习机器，Amazinglearning machine. 我们人是怎么学习的？

通过观察，通过思考，通过与环境互动。我们长大不是因为我们父母，也不是上帝在给我们大脑里面写代码。

我们之所以变得聪明，是因为观察、思考和与环境互动中学习，所以人工智能具备了这种自主学习能力，这对人类的意义是非常非常重要的。

这是我们历史上第一次有能力，建立这样一个体系，一旦我们在接下来5年10年保持算力算法的能力提升，我们能打造的智能体系，知识的累积会越来越强。

所以，第一，人工智能技术对人类的意义非常重要，这是人类历史上第一次有能力建这样一个体系。

一旦随着接下来五年十年的算法能力的提升，我们能打造的智能体系，知识的累积会越来越强。

第二，人工智能在历史上也非常重要。目前为止，人类历史的进展都是人的知识在提高，人有了新的能力，发明了新的方法，进而促进社会进步。

从现在开始，人和人建立的机器系统，共同发明知识。将来这些系统它获得知识的能力会远超人类，所以，在历史上也是一个非常重要的时间点。

这就是人工智能技术所带来的核心结构上的不同。

改变二：从人创造知识到人与AI共同创造知识

知识的创造和使用，在历史上也是非常非常重要的。到目前为止人类历史的进展都是人的知识的提高，人发明的新的能力，发明的新的方法推动社会进步。

从现在开始，人和人建立的机器系统共同发明知识，将来这些系统获得的知识会远远超过人能获取的知识，这在历史上是一个非常非常重要的时间点。

如果说改变一是，人工智能技术所带来的智能体系核心结构的改变，那么改变二是，从技术发展史的时间维度来看的改变。

从历史角度来看，人工智能技术是人类数字化技术的长河当中的重要一步，同时也是必然的一步。

过去 60 多年的信息技术的历史是人类数字化一切的历史，而且数字化的规模和范围越来越大，数字化进程的速度越来越快。

为什么数字化带来如此大变化？因为一旦数字化了之后，我们抽取信息，获得知识的能力极大地提高，而且任何一个被数字化的领域，创新的速度会不断地增加。

因为整个社会经济，越来越是知识驱动，数字化让我们获得知识的速度，创新的能力极大地提高。

整个 IT 工业的历史都是数字化进程的加速，基本上每隔 12 年左右都有新一代的技术，会出现比如定义性体验等因素，它们驱动数字化速度加速和范围拓宽。总之，基本上有些结构化的规则，有规律可循。

人工智能带来的改变当然不止于这两点，这两点是让非专业，非技术背景的同学理解这种改变的两个关键点：一个是智能体系的核心结构发生了根本改变，机器可以像人一样自主学习，自主发明知识；

一个是机器一旦能大规模发明知识，所有科技的、社会的和经济的领域都会重写一遍，Redefine everything 。

AI会有哪些重要发展方向

从历史总结，再展望，人工智能时代，会有哪些重要发展方向？

第一，数字化技术的平台。

第一驱动因素是前端和后端，前端主要是人机交互的覆盖率和交互的效益。

早期都是鼠标键盘加上图像显示器。苹果在这方面就迈出了一大步：手指(触控）。

一旦有了手指（触控），可以让这样的交互触达到更多人群，因为鼠标键盘加显示器让你基本只能坐在办公室，但一旦有了手指后，可以伴随着每个人将来的交互形式更广泛，自然交互，不用学，每个人都可以用。

所以，交互永远是一个驱动因素。

后端是计算资源的规模存储计算带宽，有多少信息可以处理，有多少知识可以承载，包括空间的覆盖率。

比如，分布式数据库可以覆盖一个企业，全球的互联网覆盖整个世界。

正是因为有了全球互联网，世界才变得平了，整个世界的产业链在过去20多年的重大改革，正是因为有了数据的覆盖，数字化的进程必须有商业化的生态来持续推动。

第二，定义性的体验。

每一个数字化平台商业生态它都有这样一些特征，首先，它有定义性的体验。

iPhone：

第一个iPhone拿到你手里时，你就知道新的时代来了，因为它带给你的体验是完全不一样的。

windows 95：

当你第一次拿到windows 95（历史上第一个真正好的PC），你也能感受到一个新的时代。

第一次看浏览器，你就知道将来完全是链接在一起的，知道数字化的社会长什么样。

所以，定义性的体验非常重要。

同时，要有宽泛的场景，窄的场景不够用，办公足够宽。搜索、电商、社交，你必须要有宽场景，同时，要有有效的商业模式，只要这些要素到位，这个平台才可以撑起来。

第三，数字化进展可以被延续加速。

我们总结一下过去历史上，数字化一开始就是IBM把桌面数字化了，再就是微软，它把整个企业的信息管理数字化了，全球已经是几万亿的工业。

接下来就是苹果，苹果把人的社交行为、电商等数字化了。

在人工智能时代，数字化的本质开始变化，范围可以扩充到几乎物理世界上的所有地方，为什么？因为在人工智能时代通过传感器，通过感知体系、思考体系和活动体系，物理世界和数字化的世界彻底融合在一起了。

由于这样的技术，每一个物理实体都将是一个前端，我们可以做交互。数字化的进程大概有这几类我们能预测的第一智能物件：

① 通过对话型的助手，每个物件都可以做交互，都是前端，

② 自主体系。能够自动驾驶车辆、机器人。

③ 智能场所。像亚马逊购物这样的新零售，将会越来越多的带来智能的空间和时间。

同时，后端将是智能云，包括大规模的数据和知识，像人的大脑一样。

所以，通过历史我们基本可以预测到人工智能时代它的前端至少有这些内容，它的后端以知识为主。

有了这一基础后，我们再看在AI时代它能带来什么样的创新机会？

AI时代能带来什么样的创新机会

在回答这个问题前，我们先回看一下历史。人类的历史上，我们的经济行为、生活水平，在过去一万多年当中几乎没怎么变，大概到三百多年前才开始变。

仔细看一下，为什么会造成人类社会活动、生活水平加速提高的核心原因，是通用能力的发明。

在历史上，我们很早就发明了一些通用的能力，比方说把植物和动物家有化了、驯化了，发明文字等，但是只有到三百多年之前，我们开始发明了越来越能量强的通用能力，包括蒸汽机、火车、计算机、飞机等。

但是人工智能，它是这些发明中最通用的，因为知识可以用在任何一个应用里，知识是最最通用的，同时知识的能量又是最大的。培根曾经说过，知识就是力量。

知识从本质上来看就是潜在的能量。有了知识可以做自动化，有了知识可以做预测，有了知识可以产生新的体验。

所以人工智能给我们带来的，是前所未有的一个通用的能力。按照这个历史纵观，接下来要发生的将是巨大的变化，这个变化核心驱动是知识。

如果用人工智能来驱动商业上的创新，它一定会遵守这样一个规则：

首先人工智能要创造价值，必须要有应用场景，有了这个场景之后我们可以找任何一个场景，最好是端到端的一个宽的场景，这样的话人工智能提升效率的程度会更大一点。

首先第一要问的，“我们要什么样的知识，我们希望知道什么”，来把这个场景的价值给它提高。

一旦从这个起点之后，你马上要回答的问题就是，“我们有什么样的数据”，数据都不是无中生有的，数据永远产生于对环境的观察，需要数据的话，你必须要有传感器。

人类历史上也是这样来获得知识的，如果人类历史上没有望远镜，没有显微镜，我们就根本对物理世界没法了解。

所以今天人工智能创新，你可以看到，创业公司做传感器的特别多，核心原因是你必须始于这里。

要有知识的话，你必须要观察，你必须要有数据，有了数据之后，我们可以从当中抽取知识，抽取知识的方式。

包括软件 + 硬件 + 算法，有了这些知识之后，我们可以决定，如果我们知道这些，我们想解决这个问题，提高这个价值。

我们应用这些知识来达到我们的目的，达到目的之后，我就创造社会价值和商业价值，到时候会有更多的数据，造成这样一个闭环。

这里我强调一下，数据一定要是活的数据才有价值，一次性的数据一点用都没有。

所以一定要有商业生态，数据才会真正有价值，因为应用不断在变，技术不断在变。

Application drift and platform drift ，数据一定要是活的，做过多年产品你就知道了。所以一定要有这样的闭环，这个模式是任何人工智能创造价值必须遵守的。

有了这样一些结构化的思路之后，我们再纵观全局，对人工智能时代带来的改变和创新机会进行两点梳理：

第一，我们会有全新的信息工业。

首先，如前面所说，将来的计算要领先，要靠前的是观察体系，要有很多新的传感器，特别是光学传感器，不光是传感器。

在传感器上必须带有计算的能力，所谓叫 on-sensor silicon software models，这我认为是目前的创新前沿之一。

同时整个芯片从底到上必须重建一次，今天的 X86 ARM 的系统架构根本不 work，它是假定 Von Neumann，假定是你的数据的维度是比较低的，你的 ControlForce 可以预测的，你的 Cache Hit Ratio 一定要足够高。

人工智能时代，实际上根本没有这些特征，都是高维度的数据，必须是大规模的平行处理。

所以整个硅晶片的工业一定会被重写，指令集可以起一点作用，但是主要的硅晶片都是在ASIC ( application specific integrated circuit ) 或者FPGA 这一队。因为大规模的训练和推理是主要产生商业价值的硅晶片的应用。所以整个芯片工业这一队会被重写。

同时软件一样，从底层的 fabric 到中间的 middleware，到操作系统，到应用开发，到工具都会要重新建立，所以如果你是在IT 工业的话，创新的机会特别多，大的企业都面临挑战。

第二，将会诞生一系列新的支柱型新产业，以前没有过的产业。至少会包括：

① 对话式的以个人助手为基础的智能物件，将来是一个可以唤醒万物的世界；

② 自主体系，自动驾驶、机器人，新的移动，这是真正物理世界的移动；

③ 智能场所，任何一个物理空间，起源于零售，因为它价值很高，但是游戏规则会是一样，一旦智能化之后，可以大规模地提高商业价值和社会价值，所以这一些都是将来新的支柱型的产业。

同时，任何一个现有的产业，娱乐业也好，制造业也好，金融、医疗、教育、零售，所有的行业，都可以用人工智能技术，来提升和转型。

因为它带来的是知识，你用知识可以改造，可以重建，可以提升。

任何一个人类的行业，律师、医生、教师、分析师，你的工作方式都会不一样。重复性的工作，机械化的工作都会逐步逐步被取代。

我们人可以花更多的时间。做我们更擅长的创造性的发挥性的想象性的（工作）。

一切都会被改变，这是一个完整的、覆盖一切的变化，这并不夸张，因为是人工智能技术核心所带来的机会。

如何加速推进整个创新进程？

在这样一个大的背景下，我们如何来结构化的开发，进而加速推进整个创新的进程？

这里有几个结构化的因素给你分享一下：

1. 资本。

① 金融资本。

任何一个时代有大规模的商业价值，要产生时都有金融资本和其他生产资本，所谓叫functional separation，他会走的更靠前。

某种意义上市场的贪婪会走得很快，所以我们将会看到更大规模的资本投入。因为在接下来30年40年50年里它的机会太多了，一定会有大规模的资本投入这个行业。

② 人才资本。

在大规模的工业化时代诞生了大学。专业培训，就因为工业时代需要技能，要裁缝、设计师、厨师，大规模的培养各种技能。

但在人工智能时代，人的技能适合时代要求的是创新、发明新的方法。因为机械化重复性的动作都会被逐步取代。但是人才资本也会有新的往前推进的一个机会。

③ 数据资本。

它最为重要，也更为特殊。因为数据是在人工智能时代的一个主要生产资本，所谓叫 Primary Means of Production。

举个例子：

a.农业时代的核心生产资本是什么？土地。

因为农业本质是光合作用，只有在足够的土地有足够好的温度，有足够的阳光覆盖的情况下，才可以种植农作物。

人类再聪明，人再多，也没有用，给你世界上几千万人最聪明的人，但你土地只有这么多，你就只能生产这么多。

在人工智能时代数据也起到类似的作用。

b.有些同学可能开发技术，你要做一个跟自然语言有关的，用语音做对话的。

如果你没有起步的2万小时的标注数据，给你世界上所有的工程师，也一点用都没有，你做不出来。

这不是一个人的资本问题。因为数据是知识的载体，没有这样的知识，就没法做对话，所以数据会成为一个主要的生产资本。

如果我们要推进人工智能时代创新的话，一定要关注这三个资本，金融资本、人才资本和数据资本。

2.环境。

特别是政府的政策环境。对数据安全和隐私的保护，是从数据中获取资本价值的核心关键。

同时基础建设，比如我前面讲的，无人驾驶这样一个新的支柱性产业，必须要重新构建所有路网，道路的基础建设，而且有了无人驾驶后，城市的半径会增加，这是历史的一个规则。

交通越发达，城市越大，将来的都市规模会越来越大，需要新的基础建设。

3. 以市场导向为核心的路径。

如果我们要加速推进人工智能的创新，让它创造更多的社会价值，我个人认为市场导向是最关键的一个核心路径。

市场是非常神奇的，从某种意义上来说，市场可能是人类最重大的发明之一。

市场本质上是什么？

① 转化器。

市场让我们每个人为了自己的意愿，personal private motivation，我们参与市场了。

但是我们参与市场的结果是造成了对别人有价值的服务和体验和产品。它是这样一个转化器，每个人去参与市场都是为了自己，但做的结果是给别人带来了利益。

② 优化器。

因为市场高速反应甚至实时反应，任何好的idea，有生命力的技术，有高价值的场景，市场一定会有信号指示。

没有价值的，要快速滤掉。所以市场是一个高效的优化器，市场越大，优化效益越好。

如果我们要快速地让人工智能产生商业价值、社会价值，通过市场是最有效的途径。如果你不用市场，那么你怎么知道这件事情是对的？凭什么说这是有用的？市场是没有人能逼你参与的。它的特性是造成了它是一个非常优质的过滤器，是一个加速器。所以整体我们要从资本上、环境上和市场导向上关注，做适当的工作，来推进人工智能时代的创新。

AI时代的创业

我们都知道创业是创新的摇篮，整个工业、整个社会，任何一个有生命力的，高价值的产业、企业，它的诞生就是一个创业过程。

所以，在人工智能这样一个非常特殊的时代，一个健康繁荣的早期创业生态，对任何一个国家、任何一个地域，以及全球都至关重要。

大的企业也会创新。毫无疑问，人工智能时代给很多大的企业带来很多机会，但是大的企业有大的企业的挑战，但最终的挑战往往在于文化和机制。

新的企业从零开始，没有任何包袱，速度快，所以整体上早期创业生态在人工智能时代非常重要。

我们如何来打造一个好的环境，来建立这样一个繁荣的生态？有几个要素：

1.人才。

整个经济需要越来越多的高质量的高热情的新型的人加入创业这个行业。在中国，清华是一所非常顶尖的学校，创业氛围也是非常强的。

所以，我们需要造就一个环境，让越来越多的高质量创业人才参与进来。

2. 数据资源。

前面我讲到了，如果没有足够多的数据，人再多，没有用，这由他的人工智能技术和创造商业价值的规则本身所决定。

3. 一些核心的AI科技能力。

包括软件芯片算法，这些都很重要。同时，在AI时代投资，特别是用AI来彻底的改造，提升传统行业资本的规模需要很大，资本的时间需要长线投入。

今天早期的生态投资是十年回报，根本不够，所以，在这个方面需要做很多创新和探索。

资本的规模和资本时长，一定要做适当的调整，才能充分发挥人工智能时代创造价值的特性。

包括像软银愿景基金。我个人认为这是刚刚开始，将来会有越来越多大规模的基金向孙正义这样大规模，投很长时间，他必须这样才能创造价值。

所以资本也要做改革。当然市场场景越多，规模越大，迭代越宽。这一点在中国是非常好的时机，比世界任何一个地域都强。

同时，人才和其他高度密集的资源也会起到越来越多的作用。大家都知道在美国硅谷，就是这样的一个典型。

因为需要更多的密集度的数据的整合，场景的覆盖、迭代、人才都在一起。在中国北京上海深圳这些城市都是比较理想的。

同时，我们也需要更多一流的大学，一定要长期、逐步培养黑客文化。黑客文化核心就是动手去做，通过创造性的方法来解决问题。

不要只看理论、只记笔记、只考虑问题，想到就动手去做，做了失败没关系。

因为你从失败当中可以学到更正规的一些知识，所以，黑客文化在中国高校中应进一步融入，这非常重要。

同时创业的氛围，特别是在一流的高校，在美国像斯坦福大学、MIT的创业氛围非常强。

清华在中国非常好，一定要这样保持继续推进，只有这样我们才可以建立一个非常繁荣的早期创业生态。

AI时代的创业挑战有哪些？

因为在软件时代，在互联网时代，一个创业公司的团队跟一个大公司团队，基本上处在同一条起跑线上，为什么？因为软件都是开源的。我自己个人写过很多各种各样的代码。

Linux、FreeBSD、Mexico、MongoDB、Node.JS。你基本上不要写很多代码，你只要把它拿来，而且你的代码都是针对你的产品，三四个月时间就有一个小型产品可以出来了。

在人工智能时代已经不是这样了。因为人工智能时代我们会写代码，但这些代码主要是从数据当中来学模型的，抽取知识的。

数据你要做一个跟自然语言交互有关的，这可能需要你花几万小时标注数据。第一要钱。第二是时间。

如果你创业是以计算机视觉为主，要识别所有的产品，水果、生鲜，你需要的数据、标注，代价都非常高。

所以，我们需要整个工业一起，通过大家一起努力，把创新的门槛降低，使得任何一个创业团队都能很快的去尝试，可以快速把产品做出来，再到市场上去探索。

谢谢！

本文转自公众号笔记侠（ID：Notesman）