行业内还没有把 2016 年定为人工智能的元年,但事实是在这一年人工智能技术被大量提及。我们看到了创投分析机器人,情感对话机器人,基于任务的语音识别智能音箱,对于大量的行业人士、甚至普通消费者而言,机器深度学习与机器自动化、智能机器和机器智能之间的区别是什么?人工智能(AI)可以做什么,什么不能做? 《Harvard Business Review》最近刊登了一篇来自百度首席科学家吴恩达的人工智能自述,可以解答一部分人的疑惑。
以下内容来自《What Artificial Intelligence Can and Can’t Do Right Now》:很多高管朋友都向我咨询,人工智能可以做什么。他们希望知道的是人工智能技术将会如何改变他们所在的行业,人工智能如何帮助他们重新变革公司业务。因为最近,媒体们已经开始在描述不久的将来人工智能如何改变我们的未来环境,或者也有在说人工智能未来会接管我们的世界。确实,人工智能已经在改变一些行业,比如搜索、广告、电商、金融、物流以及媒体行业。作为 Google 大脑团队的创始领导人,前斯坦福人工智能实验室的主任,目前是所有百度 AI 1200 人团队的负责人,我很重视培养全球领先的 AI 组织,也开发了一些被数亿用户使用的 AI 产品。看到了 AI 的影响后,我确实认为,AI 可以变革很多行业,但这也不是万能魔法。为了让人们了解 AI 与业务本身的结合,我们抛开那些大肆宣传的言论,看看目前 AI 在做什么。惊人的是,尽管 AI 有很广泛的影响力,但所触及的场景还极为有限。不过几乎所有的 AI 产品都会有这样的一种模型:从一个输入数据 A 得到一个快速反馈 B。
举几个例子:如果我们能够输入 A 快速得到 B,这就足以改变很多行业,从 A 到 B 的这种软件层面的构建被称作监督学习(原文为 supervised learning)。A 到 B 的这种系统也离我们在科幻里看到的那种机器系统差得很远,人类智能要比 A 到 B 的系统高级得多。但这种 A 到 B 的系统发展得非常迅速,目前最好的一个就被称作深度学习或者叫深度神经网络,它基本是受到大脑的启发。当然目前这个系统也离科幻里的那些系统差得很远,一些研究人员也在探索其他形式的 AI,在一些特定情况下证实可行;或许还会存在更高级别的智能突破口,但目前还没有一条清晰的发展路径。
今天的监督学习系统还有一个致命弱点(原文为 Achilles’ heel):它需要得到大量的数据。你需要给这个系统提供大量的 A 和 B 样本,比如一个图片标注系统需要你提供数以千万的图片 A 样本以及可以说明图中是否有人存在的 B 样本。而开发一个语言识别系统则需要数以千万小时计的语音样本 A,同样多的转录样本 B。
所以 A 到 B 的这种系统可以做些什么?这里有一些普遍观点:如果一个人进行一项任务需要少于一秒的时间,那么我们可能会在将来使用 AI 对其自动化。目前人们已经做了很多有意义的工作——比如检查监控录像发现可疑行为,在汽车快要撞到行人时的自动检测,查找和删除一些违规发帖——这些工作都可以在一秒内完成。这些任务对于自动化而言已经非常成熟了。当然这些适用于一些比较宽泛的环境和业务流程,重要的是要搞清楚其与你其他业务部门的联系。
AI 的工作同样需要谨慎地选择 A 和 B 样本,以及我们要为 AI 系统提供必要的数据让它搞清楚 A 和 B 样本之间的关系。通过创新性地选择 A 和 B 样本就已经可以颠覆很多产业,当然它还可以变革更多。当明白了 AI 能做什么,不能做什么之后,下一步公司高管就应该将其和自己的战略结合起来,这意味着需要理解哪些价值是被创造出来,难以复制的。AI 社区是非常开放的,大部分的研究人员会分享他们的观点甚至开源的代码。所以在这个开源世界里,最稀缺的资源变成了数据和人才。
数据:在很多顶级的 AI 团队里,他们最多一两年就可以复制(开发)出其他软件系统的代码。但获得其他人的数据就会变得非常困难。因为数据,而不是系统(代码),是很多企业业务的屏障。
人才:简单的下载和“申请”其他人的开源代码去适配自己的数据是不可行的。AI 需要的是量身可定制化的业务和数据。这也是为什么现在人们热衷于抢夺 AI 的稀缺人才。很多对于 AI 潜力的报告都是在分析对于人类的好处和坏处。比如我们看到 AI 能够通过与人对话来安慰人类的孤独;我们看到 AI 也会牵涉进种族歧视的问题。就近来看,随着 AI 可以自动化人类的一部分工作,AI 可能会造成人类的失业。作为领导者,我们会确保建立一个每一个独立个体都有自由发展机会的世界。明白 AI 能做什么以及如何整合到你的业务战略中只是这个进程的开始,不是结束。