在人工智能领域,“深度学习”这个词意味着这个软件可以通过实践经验改善算法模型的表现。比如谷歌在2012年发起的一个项目,让一个运行在16000个处理器上的神经网络浏览了1000万个Youtube上的视频后,算法自己学会了识别猫脸。
这个项目的领导者:吴恩达,现在已经加入了百度的百度研究院并成为了其首席科学家,百度和谷歌、微软等搜索服务商一样对机器学习有着天然的兴趣。所以百度2014年在加州森尼维尔市成立了百度研究院,负责AI领域的研究。其包含三个部分:大数据实验室、深度学习实验室和硅谷AI实验室。
促进人类和机器智能的合作是吴恩达研究的一个主线,在2008年的时候他作为斯坦福大学的计算机科学教授,在网上开设了一门在线机器学习课程。这门课程最终发展成为了该校广受赞誉的MOOC在线教育平台的旗舰课程。这门课的学生数在几年内迅速发展到了10万人以上。2012年,吴恩达和斯坦福大学的同事Daphne Koller建立了Coursea,一个给学生免费提供一流大学教育水平的在线课程的技术教育公司。吴恩达在成为它的董事长的同时,也保留了他在斯坦福的职位。
吴恩达是技术发展的领军人物之一,经常公开叙述在日常生活中智能设备会给我们带来的便利。在三月的旧金山数据大会的演讲后,吴恩达接受了商业战略(Strategy+business)的采访。在采访中,他再次强调了他在大会上表达的观点。在这个为更高的回报价值而优化的端对端战略中,公司的受益会是最大的,对无论是对个体还是对企业,而最终全世界都会受益。
S+B:深度学习是什么,它能给一个公司带来什么价值?
吴恩达:深度学习是一个已经发展了数十年的想法的新呈现方式。在最开始的时候,人们先是开始用从大脑的结构中获得了某些灵感的智能神经网络进行试验。但直到最近我们的电脑发展出了这样的计算能力,也拥有了如此庞大的数据,以及拥有了能帮我们构建能够在没有人类的程序员的设计和指引下自主学习到一些有层次的概念的神经网络的专业知识之后。(这些神经网络)才开始能够帮助提取、组织和处理现代公司中这些复杂的数据。
在几年前,我们发现深度学习终于开始表现得比传统的AI实现方法要好了。以前的那些AI是完全不会知道如何处理我们现在处理的这种规模的数据的。
在过去的五年里,我们终于拥有了足以建立庞大到能处理我们从互联网和移动设备中收集到的这么大规模数据的神经网络的计算能力。通过建立这种大规模神经网络,我们可以检验我们深度学习算法的表现情况。而随着我们给算法输入越来越多的数据,它们的表现也会越来越好。这意味着我们能做出远比现在更精确的模型和预测,并且用我们收集到的这些数据来发现公司中的问题。
对于少数企业来说,深度学习可以为其带来惊人的收入增长。搜索引擎和在线广告可能是短期来看AI最重要的应用了。搜索结果能更贴近用户的需要的话,无论是对广告商、对用户还是对我们来说都是件好事。
S+B:你觉得接下来的十年内深度学习会如何演化?
吴恩达:我发现深度学习的前沿在同高性能计算产生越来越密切的关系。我和我们的团队建起了非常强大的超级计算机来充分发挥我们所拥有的海量数据带来的优势。
短期内深度学习带来的大部分商业价值都是来自于我们称之为监督式学习的算法。比如:我们给算法看一个Email,算法就能判断它是不是垃圾邮件。或者我们给出一个广告,它就能预测用户什么时候会点击这个广告。我们已经从监督式学习中创造了巨大的商业价值。而且我们认为在将来的几年中我们还能在这其中顺利的创造出更大更惊人的附加价值。
但是往更长远一点的方向看的话,我觉得很多项目,比如像图像识别和语音识别这样深度学习已经在其上取得了巨大进展的项目。它们不仅会为公司创造巨大的经济价值,也会让我们的世界变成一个更好的地方。
就单看自动驾驶汽车这一项上的发展,深度学习就能为我们带来比现在安全和方便得多的出行体验,不管是从增加人们的预期寿命还是帮人们节省很多时间来看,它实际上都给我们每个人的人生凭空增加了几年的可用时间。有数据表示,汽车事故可能平均减少了孩子们三年的预期寿命,美国人一生中平均也差不多有三年是在车上度过的。所以,在某种程度上我们可以说我们让每个人的人生中都多了六年有意义的时间。这听起来真的很不错。
S+B:你提到了自动驾驶汽车,这东西真的那么快就能实现了吗?
吴恩达:是的,我们希望在三年内做出能商业化应用的自动驾驶汽车,并在五年内实现大规模量产。最终过程的时间段其实很难预测,但这个时间是我们觉得最有可能实现的时间了。
对目前自动驾驶汽车的状态来说,似乎有一个与手动驾驶的类比是合适的。当你的车开入一片工地的时候,它表现得必须和在普通的街道上行驶的时候不一样。它必须要开得慢一些,还要注意建筑工人。
我现在还不觉得近期计算机视觉能可靠的分辨出建筑工人打的手势(比如停,走和减速)的含义。但是我们可以通过适当改变基础设施的设计来解决这个问题。比如给建筑工人一个无线信标。同时适当调整一下道路的设计和建造方式以及社会期望。我们可以使无人驾驶汽车成为现实,并且让它比人类驾驶的汽车安全得多。
我想用AI,通过嵌入环境中的那些智能设备来创造一个更好的社会。现在的语音控制就像2000年初的触屏设备那样。太初级了以至于很难具备什么实用价值。但随着iPhone的发明,乔布斯和苹果发现了让触摸屏变得有效率的方法。语音控制也会经历类似的变革的。他们会影响社会的方方面面。想象会遵守我们语音指令的机器人和机器人警卫。我希望将来我的子孙们会奇怪,为什么我们这个时代想要调空调的温度的时候还需要去转刻度盘,而不是直接告诉房子“我们觉得有点冷”。
S+B:你曾经在四个大型组织中工作:斯坦福,Coursera,谷歌和现在的百度。作为一个一直想要促进深度学习发展的人,你觉得我们应该怎样合作来创造一个更好的算法?
吴恩达:我花了很多时间来试图建立一个目的就在于确保我们研究的所有成果都确实能帮助到足够多的人的组织。因此我们参考了百度研究所这样端对端研究组织的架构。比如说,如果有人发明了深度神经网络,那我们就负责搞清楚他需要的数据来自哪里以及他怎样把这个成果应用到他的产品中去,以及,这个东西在最后怎么提高我们的生活质量。
在Coursera,我最骄傲的那些时候是当高层面临一些艰难的抉择的时候,会有除我以外的其它人站出来,说,“让我们回归本质去思考,搞清楚到底什么是对学习者最好的选择然后先做那个。”
我真的很欣赏这种回归本源的思考方式。有太多人陷入一件事不能自拔,只是因为他一直在做那件事或者其他人一直在做那件事。他们做事的结果可能看起来比较有效,但很可能算不上什么真正的成就。
S+B:如果想让AI和科技为人们更好的服务,人们需要信任体制。但人们对庞大的体制的信任正在削弱。你怎么解决这个问题?
吴恩达:我觉得我们需要与政府和社会更紧密的合作来解决一些与AI相关的问题。比如,一个非常大的可能的问题是裁员。作为技术人员我们应该对这个问题坦诚一些。美国有350万卡车司机。当自动驾驶系统发展成熟了,他们怎么办?类似的是,AI会对医学影像科的那些专家造成怎样的影响?有些人可能需要开始规划将来的出路了。
一般来说,新的技术都会给人创造新的,更有意义的角色,这次可能也会。不过在这个过程中可能会出现一些问题。这就是我支持为那些找不到工作的人确保一个最低(福利)收入的原因。但是我们应该要求那些获得这些福利的人保持学习。如果我们能给那些无业人员获得技能的报酬,对他们和社会都是件好事。世界正在以前所未有的速度变化,为了跟上它的步伐,我们必须保持不断的学习。