首页文章阅读微信小程序高质量微信号古诗词大全

微信扫一扫
分享到朋友圈

专栏 | 对话OpenAI Jack Clark：中国是人工智能领域的领军者

作者：机器之心来源：机器之心公众号

分享到：

10-17

机器之心专栏

来源：eye-on.ai

Eye on A.I. 是由纽约时报资深记者 Craig S. Smith 主持的一档双周播客节目。每一期节目，Craig 都将与这一领域有影响力的人物进行交流，推进广义环境中的机器智能新发展，思考技术发展新蕴意。

机器之心为此系列华语合作方，为大家带来此对话的中文译文，读者可点击「阅读原文」查阅原英文字幕对照收听音频。以下为此系列内容的第一篇，Craig Smith 与 Jack Clark 就全球 AI 发展进行了探讨。

大家好，我是 Craig Smith，这是我创建的一个关于人工智能的播客。今天与我对话的是 Jack Clark，他是很受欢迎的 Import AI 新闻订阅源的作者。今天我们要谈谈他过去一周了解到了什么以及为什么这很重要。Jack 是英国科技杂志 The Register 和 Bloomberg News 的资深行业老兵。他现在也为 Elon Musk 资助的非营利性人工智能研究公司 OpenAI 工作，致力于政策和沟通问题。所以你可以把今天的播客看作是对当前人工智能世界的概览，而且是来自一位最敏锐的观察者。

Craig：首先，我想谈谈本周订阅的最后部分的内容，其中你谈到了有关达沃斯世界经济论坛上所涉及的内容。有一件事上了很多头条，当然也引起了我的关注，那就是谷歌的 CEO Sundar Pichai 对 AI 崛起的评论，他说这比发现电甚至火还要重要。而且你也能看到很多类似的评论。但是，这些话从 Pichai 口中说出，还是挺让我惊讶的，尽管我没有密切关注过他。在你看来，这样的表述是否夸张？

Jack：并不夸张。而且我觉得他能正面谈论这个问题是很值得称道的，因为有很多公司高管都一直在讲，这项技术和之前的颠覆性技术有一样的属性，比如智能手机的出现。实际上人工智能技术的本质存在根本性的不同。而且尽管当我们听到人们谈论电和火时，我们会认为他们说得实在太过夸张，但我相信如果你思考一下 AI 会在未来的几十年，而不是几年，会如何发展，我们回头看时也会有一样的感觉。从历史角度看，很可能看起来就像是计算机突然就发明出来了，之后很快计算机就具有了接近人类的能力。在那之后不久，我们看到 AlphaGo 这样的计算机很快超越人类的事情出现了。这是非常不同寻常的，我认为这意义重大。

Craig：是的，我同意。我想我只是对时间轴有些疑虑。我能想见超级智能和智能爆炸会在人类历史的某个节点发生。只是我并不乐观地认为会在这个世纪发生。但未来会发生……

Jack：嗯，其实并不需要是超级智能。我要反驳一下你的看法；当然，如果确实出现了，那超级智能显然是个大事件。但人工智能成就重大的变革并不需要超级智能的出现。

想一想数据库或电子表格的出现究竟给世界带来了多么大的变化。让计算机管理复杂繁琐的文本信息是推动实现全球化的一大力量。现在，我们有能力让计算机具备基本的人类感知能力，比如对视觉的近似、对听觉的近似，而且它们将生活在一个实际上为人类的听和看而构建的世界里。

所以，只要尝试想象一下现在计算机能够使用多少信息，然后再思考一下过去 30 年电子表格或数据库所造成的影响，那我就能让你明白我们并不需要超级智能就能改变世界，而且改变的程度将远远超过数字革命迄今所造就的一切。对我来说，这非常让人振奋。

Craig：是，我当然认同这一点。他谈到了对全球多边框架的需求，而且 Theresa May（英国首相）也树立了国家的旗帜，要成为 AI 道德伦理方面的领导者。

考虑到我们在核能技术或核武器技术方面如此地不成功，我们真能构建一个各个国家都会遵守的多边框架吗？这是不是过于乐观？

Jack：在座的我们两人都不能说出在第二次世界大战之后地球上有谁因为愤怒而使用了核武器。另外，我也要对你说，我们建立了一些有效的机构，因此我们现在才没有谈论广岛和长崎事件之后的悲剧。有大量的证据表明我们围绕核武器所构建的国际治理体系是有效的。当然也存在问题。现在是 2018 年，现在我们离核毁灭结局的末日时钟仅有两分钟了，这是很长时间以来最接近毁灭的时间。但不管怎样，我们仍在坚持。

所以，不，我并不认为这过于乐观。我确实认为这有些乐观，尤其是某个来自英国的人想成为领导者，而这个国家正在脱离欧洲，因此也将脱离一个有力量的区域。我也确实相信我们能看到各个国家合作构建各种 AI 标准。而且我还相信你肯定会看到围绕 AI 的国际社区开发出相应的规范，约束其在军事上的应用。

除了少量恶人之外，现在我们已很少看到人们使用化学武器和集束炸弹这样的武器，这都多亏了国际规范的建立。是的，确实存在例外，但我们知道我们能做成这件事，只是极其地困难。但困难并不意味着我们应该回避这个问题。

Craig：是的。但我想人工智能终究不同于集束炸弹，在使用时被检测到的难度要大得多。对于 Theresa May 宣称英国将成为 AI 领域领导者的言论，就我看来，因为我的工作很多都在中国，我觉得中国才是显而易见的领导者。原因很简单，因为他们有一个由中央掌控的经济模式，得益于此，他们有大量不在乎成本的国有企业和机构。他们拥有最多的人口，并且正在培养最多的工程师。

你认为英国这样的国家有机会成为领导者吗？另外，对于这种西方国家想要控制的框架，中国这样的国家会参与进来吗？

Jack：这个问题真的非常复杂。我会将其分成几个小问题来说。英国这样的国家有机会吗？我表示怀疑。因为我们知道 AI 需要从国家层面占领科学和技术发展的制高点。尽管英国有一些 AI 优势，但我认为很大一部分优势都源自 Facebook、谷歌和微软等美国公司对英国的投资。英国的创业生态环境也在某种程度上取决于此。

May 首相让人觉得这完全是国内发展起来的，但如果你看看是什么因素带来了这样的发展，你会看到实际上来自别处，那里有多得多的资金，而且有更广泛的科学和技术文化。

接下来的问题是，我觉得美国、中国、印度或俄罗斯等更大的国家，甚至通过其特定的投资，能够成为国际 AI 发展的领军者吗？是的，很有可能。我认为我们将看到力量核心的兴起。

现在回到关于规范的问题，这些不同的力量核心会尊重大多数人试图设立的这些规范吗？基本上不会。基本上而言，人们会继续做他们一直都在做的事情，也就是发展自己的经济，在地缘政治边缘政策的国际博弈中互相竞争。但是，仍会有不同之处，你之前也提到过，AI 有可能造成很大的伤害，所以这会激励人们围绕特定的规范进行合作，这就涉及到了人们开发和使用 AI 的方式。即使你对自己如何参与国际舞台上的竞争有自己的看法，你也会希望能够对你的竞争者或对手以及他们使用这项强大技术的方式具有一定的信心。

所以，我确实认为你提到的中国这样的国家有动力去遵守一些规范。但我也确实认为他们会遵守的规范的数量会相对少一些。

Craig：是的，我们之前谈过这个，问题是中国是否会公布他们所做的一切。我想你肯定也同意，中国在做的很多事情没人能看到。这肯定会引起某些担忧。

你在本周的订阅消息中还写到了另一件事，佛罗里达州的一个学生使用计算机视觉和深度学习创建了一个对流行的多玩家网络视频游戏《英雄联盟》的实时概览。让我惊讶的是这相当简单而且成本低，不管是资金成本还是计算时间。这个家伙成功提供了一个解决方案。

这也凸显出其实存在很多可以使用的数据——如果你知道如何使用的话，因为他的这个项目其实就只使用了游戏视频。除此之外，我不确定我明白他所做的工作在游戏世界之外的应用。让我惊讶的人这个佛罗里达的学生仅用少量资金和公开可用的数据集就提出了一个解决方案。我想将会有越来越多这样的事情出现。

Jack：是，我认为你谈到了一个真的非常让人感兴趣的观点。为什么有趣呢？嗯，并不是因为他们有能力为电子竞技创建炫酷的小道具，或者说为你和大部分人都没听说过的计算机游戏。

真正炫酷的是这个小道具让他们可以获取有关游戏的信息——游戏公司可以通过提供给开发者的游戏应用程序接口来提供，但却没有选择这么做。所以，从某种程度上讲，这个项目的重要意义在于他们只是证明可以使用这种强大的技术来处理从游戏中收集到的数据。这么做本质上是让深度学习算法临时创造了公司不希望人们访问的底层 API。

所以，当我们思考这个项目的意义时，这真的会勾起我们对专有软件的工作方式的疑问。因为专有软件的假设是我能向你出售某个软件，因为你能从这个软件获得价值，你不能就通过观察这个系统的输入和输出就克隆出这个软件。

而我们现在可以感受到，使用很多 AI 技术，我只需要输入和输出就能构建出其它部分。这不禁会让我们思考这个时代的 IP 保护方式和基于 IP 的商业业务。

Craig：确实，佛罗里达的这个学生只用开源软件和公开可用的数据就创造了这个出色又有趣的方案。这样的工具现在有很多，比如 Facebook 就公开提供了 Detectron。你觉得，从重金支持的实验室到车库就能生产的东西，这种 AI 的民主化快要来临了吗？我的意思是人们能在家中自己动手就做出重大的成果吗？

Jack：不行，很遗憾。我可以解释原因，我不知道我的回答是否会让你感到失望，以至于你不想继续谈。你想要我解释我认为这做不到的原因吗？

Craig：我很乐意听，请解释。

Jack：你看到的那些公开项目都源自大公司的计算红利。他们投入了大量电费来开发某些性能卓越的系统。这里说的是一个能让我为世界绘上边界框的研究平台。这代表了技术研发的基本商业化效应。这意味着世界各自在自家车库中创造的人现在都可以获得这种基本能力了。

以同样的方式，可以让网络相机观察世界，然后提供其图像中最可能存在的事物的标签。现在已有这样的商品了。你还可以将你的相机对准某个特定的物体，就能得到有关它的大量信息。或者你可以指向特定的区域，就能让它为你提供一些有用的信息。

但这些都代表不了技术前沿。技术前沿会存在于大得多的计算机上，比任何创业公司所希望的或个人在车库中所用的计算机大很多。这会需要一些尚未出现在研究论文中的研究技术。在能力的差别将具有重大的影响。

AI 世界目前每隔六个月就会大变样。过去这个时间段是好几年。更早之前甚至要每隔十年才有大变化。这项技术正在倍速发展，变革周期也在缩短。所以，Facebook 等巨头的竞争优势将会随时间越来越大，因为他们有能力研发越来越庞大的模型。我可以举一个非常形象的例子。

如果我有一家创业公司，我可以使用 Detectron，我也可以使用残差网络、highway 网络或其它的先进深度神经网络系统。我甚至能获得数据。但如果要做出一些有用的东西，我仍然需要使用自己的数据来训练一个模型，这需要一定的时间。训练时间的长短取决于我能够使用的计算机。我不知道你的车库有多大，但我敢说肯定不会有足球场那么大。然而，Facebook 的计算机能摆满足球场。这意味着当 Facebook 想要做点研发时，开发速度会超过任何在车库中搞开发的人。

所以，如果 Facebook 的实验能力和发现新 AI 技术的能力与其所能使用的计算机数量成比例，那么这个世界上就很难有创业公司能轻松与这些 AI 巨头竞争，因为他们根本没有足够大的计算机来帮助他们足够快地完成实验。就算创业公司能从这些公司取得一些计算红利，也难以与之抗衡。

Craig：也许这些计算红利能够产生回报，比如做巨头没有兴趣或不愿花时间的更小型的应用。

你还写到了 DroNet，这是一个瑞士和西班牙的大学之间的一个联合项目，目的是训练能在城市街道上飞行的无人机。他们使用了来自自动驾驶汽车的公开可用数据并且使用了自行车创建了自己的数据集。我觉得这也是个不错的项目，同样没有用到巨额投资，同样基于开源技术。我想他们用的是 Parrot 无人机，一种较便宜的消费级无人机。这些应用中的计算红利是否会开始在更局部的层面上发生？

Jack：是的，在某种程度上，你会看到在这些边缘位置的一些创新。这当然是肯定的。他们训练无人机所用的数据集包含两部分。

一是自行车。他们没有优良的撞车数据集。所以他们给一辆自行车绑上了一个 GoPro 或类似设备，然后故意让它撞到障碍物来模拟撞车情形。我很高兴能在他们的论文读到这一点，因为他们并不是简单地直接生成数以万计的撞车事件。对于不得不去做这件事的研究者，我表示同情。

他们实际上做的是先加速冲向障碍物，然后故意减速，并将障碍物标记成无人机应该避开的东西。所以当然他们生成了一些自己的数据，但你也会注意到实际上至关重要的数据是真实的汽车驾驶数据，这些数据能告诉无人机如何转向、如何按道路行驶。这些数据来自 Udacity。是 Udacity 为自动驾驶汽车在线教育课程所生成的数据集。

Udacity 自动驾驶汽车在线教育课程由 Sebastian Thrun 主持，他曾帮助设计了谷歌的自动驾驶汽车。Udacity 本身得到了风险资本的数千万美元投资。而且在谷歌的自动驾驶汽车项目上秘密工作了四五年后，Sebastian Thrun 也知道如何创建这样的数据集。但这些都不能让我信服地表明谷歌失去了任何一点领先优势。

事实上，刚好相反，我们现在看到的都已经是后期的研究项目，是那些公司很多年前的投资所产生的成果。这些公司的项目对我们而言都有一定程度上的不透明，能力如何也并不非常明显。是的，DroNet 确实有些值得关注的能力，比如能做些有用事情的无人机。但想象一下，如果用谷歌那巨大的内部自动驾驶汽车数据集来训练无人机，无人机的性能会好多少？

我觉得现在你已经明白，Waymo 知道自己立马就能训练出一个比那篇论文好很多的无人机导航模型，因为他们拥有的图像远不止 70000 张，而是 7 亿张。

我还想强调一下这个观点。AI 生态系统中很难再具有有效的竞争。还没有任何证据能让我相信创业公司能轻松地活下去。事实上，我看到的所有证据都指向了反面。

证据表明，创业公司要么使用大公司的计算红利，要么就抓住大公司投资滞后的间隙，否则他们就要在大公司具备天然优势的领域与之竞争——大公司只要利用一下这个优势，就能轻松碾压创业公司。

Craig：这是否说明聪明的年轻工程师基本最终都会为谷歌、Facebook、Uber 或亚马逊等巨头工作？

Jack：是的，在我看来是这样。这向我们表明使用开放的工具开发 AI 并做出贡献是很容易的，而很多工具都是由这些大公司提供的。我还没看到任何一家新兴的创业公司具备真正超越顶级学术研究机构的能力，更别说超过那些大公司了。

在我看来，AI 将会挑战我们的很多反垄断观念以及很多有关技术竞争方式的观念。因为就算大公司开源了大量资源或通过研究论文公开了研究成果，技术实力的差距还是会越来越大。这是非常矛盾的，这意味着监管者看到的现象都表明这个市场是健康的，因为有创业公司，也有大量开放的创新，还存在很多共享。

但如果究其根本，看一看资金的来源，谁有能力支撑数据或计算业务的战略资本，谁拥有人才，你就会发现正是那些大公司像顽疾一样掌控了竞争的基础。

Craig：是的。承受压力的是公司，不是国家。

Jack：我们不能从国家方面来看待这个问题，因为目前还没有国家表现出连贯一致的科研议程。

对于中国这样的国家中的组织机构而言，你会看到在政府、私营企业和公共部门之间存在非常紧密的联系。但其中没有任何一个能说是中国的研究。更像是在追赶谷歌、微软和亚马逊等公司时所不得不做事——必须打出手中的每张牌。

对于中国的情况，他们有大量数据，有大量内部商业，就像你的公司一样，另外政府还有能力和资金让事情发展更快并且实现加速。但我要说没有任何论文是中国特色的，我也不会说「哦，这篇论文是比利时风味的，或者说那是一篇德国的论文。」

我认为我们还没到这些力量核心能够体现出来的时候，但从国家 AI 研究计划的实现角度看，它们将会得到体现。实际上中国是唯一一个在国家层面上推动 AI 研究的国家，而且它才刚刚开始。所以，我们还需要等上三四年时间才能看到这些初期投资的成果以及他们所选道路的目的。

Craig：这让我想起了 PsychLab，我觉得这个项目很激动人心。我想这应该是心理计量学（psychometrics）方面对比人类智能测试 AI 的开始。你能谈谈这方面吗？

Jack：PsychLab 是一个来自 DeepMind 的深度学习和强化学习测试套件。PsychLab 不仅能让我们测试和评估强化学习算法的性能，还能让我们了解它们在人类心理学测试上的表现。这意味着现在你可以基于认知科学测试 AI 算法，你还可以让人类来进行同样的测试，然后比较他们的结果。

在我看来，最有意思的是 PsychLab 能让 DeepMind 的科学家知晓某些与他们的算法的相对表现和缺陷相关的非常有价值的数据点。在一个案例中，他们执行了一项测试——询问他们所测试的来自一个名叫 Unreal 的系统的强化算法，哪个系统是表现最好的以及得到了最好调节的。

他们让它执行了一个认知科学中非常基础的测试，即查看不同集合的同心圆。这被称为碎玻璃问题（shattered glass problem）。目标是确定哪一组具有最大的同心度。他们发现，相比于人类，Unreal 智能体的表现非常差。他们给出了假设，也许其表现差的原因是这些 Unreal 智能体的注视和视觉系统的工作方式与人类视觉的工作方式存在非常大的差异。

所以，最后他们实现了一个严重依赖于所谓的中央凹视觉（foveal vision）的视觉系统，即你的眼球中央所具有的感受器多于周边时的视觉。这能让你重点关注近处的物体，并且你视觉中心的事物在你眼中的分辨率也更高。

使用传统的卷积神经网络，感受野会在所有位置均匀分布。他们所做的是将神经网络的感受野进行聚焦，正如你的眼球所实现的中央凹视觉一样。他们发现，他们不仅能创造出能以接近人类的水平通过这些测试的智能体，而且还能将完全一样的智能体放入被称为激光标签（laser tag）的强化学习环境中，这没有在这个测试套件的任何地方测试过，实际上更像是你与朋友玩的虚拟彩弹游戏。他们发现突然之间他们就创造出了擅长应对这一环境的 Unreal 智能体，并且达到了他们之前从未达到过的水平。

这说明，通过在他们的智能体上执行这样的心理学或认知神经科学测试，他们实际上找到了一个缺陷，并且修复了这个缺陷并使之通过了测试。然后他们将这个智能体用在了 PsychLab 的标准测试方案之外，也仍然表现优良。在某些案例中，其在之前从未见过的全新任务上也取得了突出的表现。

我觉得这振奋人心，因为这为我们提供了一种全新的思考方式——我们可以如何对这些算法进行压力测试，科学家可以如何将额外的工具用在他们的实验套件中以帮助他们进行诊断。

Craig：这种中央凹视觉修复确实让人着迷。另一件事我觉得也很有意思，即 Unreal 智能体与人类在玻璃图案测试（glass pattern test）中所表现出的差异。其中一个点是白色，另一个点是黑色，人类和 AI 智能体都不能有效地识别这种图案。我觉得这个问题很让人着迷。所以，在认知处理中，存在某些让人类和人工智能体都束手无策的东西。

另一个让我印象深刻的是其分析思路。在他们的论文中，他们谈到了卷积神经网络在 GPU 上并行处理特征的方式。但人类对视觉数据的处理方式主要是串行处理。他们提出了一个问题：为什么进化没有为人类提供这种看起来更具优势的能力呢？

但然后他们就注意到，串行处理的主观体验非常类似于思维的本质。因为我们是按序列串流的方式思考的，我觉得这个问题很迷人，让人开始明白人类心智过程并不同于人工智能体的处理过程，这也许能够为我们的主观体验提供某些解释。我不知道你是否认同这一点，但我觉得这很有吸引力。

Jack：我认为如果 AI 继续发展，我们将会了解到有关我们自身偏见和偏好的非常让人惊讶的事情。因为我们能够创造一个能反映我们自身的认知系统，就像一面镜子。

当你在早上或夜晚窥镜自视时，你能看到自己，但你实际上并不能从镜子中看到你的大脑认为你应该在这个世界中如何行事。因为并不存在能够模拟另一个人的镜子。我们看待他人时，只是将我们的模型套在他们身上。

这些 AI 系统和 PsychLab 向我们表明，随着我们的智能体越来越有创造力和先进，也许我们可以创造出类似认知之镜的东西，我们可以从其中看到处理同一任务时不同的思维和处理方式，这样我们也能更理解我们自己。我觉得这很激动人心。

本文为机器之心专栏，转载请联系本公众号获得授权。

✄------------------------------------------------

加入机器之心（全职记者 / 实习生）：hr@jiqizhixin.com

投稿或寻求报道：content@jiqizhixin.com

广告 & 商务合作：bd@jiqizhixin.com

查看原文

阅读8078