时间:2016-03-12 10:00 转载请尊重版权注明来源和作者
尾猿会网发布:3月9日,人工智能AlphaGo战胜韩国棋手李世石引起巨大轰动,外媒“The Verge”在比赛结束后对AlphaGo背后的DeepMind公司联合创始人德米斯·哈萨比斯进行了长篇访谈,哈萨比斯谈到了他对人工智能未来的看法。
以下是文章全文:
DeepMind的AlphaGo战胜韩国传奇棋手李世石,点燃了空前的对人工智能问题的热情。但是,这家谷歌子公司的AlphaGo计划却远远超出了它自身 - 甚至可以说它本身都不是重点。作为DeepMind的联合创始人,德米斯·哈萨比斯(Demis Hassabis)在本周早些时候表示,DeepMind要做出“智慧解决方案”,对此他有一些想法。
哈萨比斯自己走了个不寻常的路去达到人生目标,现在回想起来这却是一个完美的道路。哈萨比斯是一个在智力奥林匹克竞赛中5次获得冠军的国际象棋神童。他声名鹊起则是年轻时在英国Bullfrog和Lionhead游戏开发公司工作,在那里他致力于开发一款类似于“主题公园”、“黑与白”的人工智能游戏,后来他成立了自己的工作室。哈萨比斯在00年代中期离开了游戏行业去读完神经科学的博士学位,2010年他与别人联合创立了DeepMind公司。
在AlphaGo首次战胜李世石后的清晨,哈萨比斯坐下来接受The Verge的访谈。他在进屋时评论着首尔四季酒店(注:比赛地点)的灯光布景,给人的感觉十分温馨友好。当一个谷歌代表告诉他,昨夜有3300篇韩国媒体文章报道了他,他明显看起来非常吃惊。 “这令人难以置信,对吧?”他说, “看到一个深奥难懂的事物开始流行起来,这很有趣。”
除了AlphaGo,我们的谈话触及视频游戏、下一代智能手机助手、DeepMind在谷歌公司中的角色、机器人、AI如何帮助科研等等。
注:本次采访内容已被轻度编辑,以便于阅读。
The Verge 记者萨姆·贝福德(Sam Byford):对于那些不了解人工智能或围棋的人,你会如何描述昨天所发生的文化共鸣?
德米斯·哈萨比斯:对于这些我要说几点。围棋一直是完全信息博弈的巅峰。它在可能性方面比国际象棋更复杂,所以它一直是人工智能研究领域努力寻求突破的重大挑战,尤其是在“深蓝”之后。你知道,即使付出了很多的努力,我们还是没有走出太远。蒙特卡洛树搜索是十年前一个很大的创新,但我认为我们成功地用AlphaGo给神经网络引入了“直觉”——如果你想这么叫的话,而正是这些直觉让某些人成为顶尖棋手。我很惊讶,即使是现场解说迈克尔·雷德蒙德(Michael Redmond)也很难算出结局,他可是一个职业9段棋手啊!而这表明了你是有多么难写出围棋的“评价函数”(valuation function)。
问:当你看到AlphaGo的特殊举动,你会感到惊讶吗?
是啊。我们相当震惊,我认为李世石也是,从他的面部表情就能看出来。AlphaGo的那步棋深深地打入了李世石的领地。我认为这是一个相当意外的举动。
问:是因为(这步棋的)侵略性吗?
嗯,是因为侵略和大胆!此外,它在比赛中戏耍了李世石。李世石以好战而闻名,这就是他所传达出的,我们期待的那种东西。本场比赛一开始,他就在整个棋盘上求战,但是没有一处是真的。传统的围棋程序在处理这种情况时非常无力。他们在局域计算中并不差,但是在需要通盘视野的时候会很无力。
问:举行这次比赛的一大原因就是评估AlphaGo的能力,无论输赢。你从昨晚学到什么?
好吧,我想我们了解到:我们已经沿着这条线走出了很远 ——没有超出我们的预期,但达到了我们的期望。我们要告诉大众,我们认为比赛是五五开。我认为这仍然可能是正确的,这儿任何事都有可能发生,我知道李世石今天回来后会采取不同的策略。所以,我认为寻找出对手策略将是非常有趣的。
刚才谈到了AI的意义,回答了你的第一个问题。另一个我要告诉你的事情是,我们和深蓝是不同的。深蓝是一个“手工”程序——程序员从国际象棋的规则中提炼出信息和获得启发。而我们的AlphaGo拥有学习能力,它通过实践和学习获得知识,这更像人。
问:如果在系列赛中AlphaGo继续以这种方式取胜,接下来会发生什么?未来会有一个人工智能的游戏对决吗?
哈萨比斯:我认为作为围棋是完全信息博弈的巅峰。当然,我们还有其他顶尖棋手要比赛。此外,其他的游戏 ——像无限押注的德州扑克就非常困难。多人比赛会有其他的挑战,因为它是一个不完全信息博弈。再有明显的就是,人类在玩《星际争霸》这类游戏时比电脑更好。战略游戏需要在一个不完全信息的世界里拥有高层次的战略能力。而围棋的事情是很明显的,你可以在棋盘上看到一切,因此,这对于电脑来说更容易一些。
(人工智能)打败《星际争霸》这些游戏你个人会感兴趣吗?
也许吧。我们只对研究项目主线范围内的事情感兴趣。所以DeepMind的目的不只是打游戏,尽管那非常有趣而且令人兴奋。你知道,我喜欢玩游戏,我以前编写过电脑游戏。但是那仅限于作为测试平台,用于尝试写出我们的算法思想和测试出它能到多高等级、能玩得多好,这是一个非常有效的方式。最终,我们希望能应用到现实世界中的重大问题。
问:90年代末,我在英国长大,当时我在电脑杂志上看过你的名字,你的名字常常和游戏联系在一起。当我第一次听说DeepMind,看到你名字时,我在想:“真是绝配。”之前你在游戏行业的职业经历对于现在所做的工作有何影响?
哈萨比斯:类似DeepMind的东西一直是我的终极目标。从某种意义上来说,我在这方面的计划已有20多年时间。如果你从这种角度来看,即我所做的一切都是为了最终进军人工智能领域,那么可以发现我的选择是合理的。如果熟悉我在Bullfrog等公司的工作,那么你会知道,人工智能是我所做一切的核心。很明显,(Bullfrog创始人之一)皮特·莫里诺克斯(Peter Molyneux)的游戏也都是人工智能游戏。
16至17岁时,通过开发《主题公园》,我意识到如果继续发展人工智能,那么人工智能将发挥巨大的力量。我们卖出了数百万个拷贝,而许多人都喜欢这款游戏。正是由于人工智能的存在,这款游戏才可以适应玩家。我们随后继续进行开发,而我也在游戏行业的职业生涯中试图继续发展这一技术。
随后,我退出了游戏行业,回到了学术界,从事神经科学的研究。因为在21世纪00年代中期,我感觉通过游戏这扇“后门”去展开人工智能研究已经非常困难,因为游戏发行商只想要游戏。
问:当时,游戏是否是人工智能唯一显而易见的应用?
哈萨比斯:是的,我认为是这样。实际上我认为,当时我们正在开发技术极其领先的人工智能。我想说的是,那时学术界还停留在90年代,而所有新技术都尚未普及,也没有得到大规模应用,例如神经网络、深度学习和强化学习。因此,最优秀的人工智能技术存在于游戏之中。
当时的技术不同于我们目前开发的学习型人工智能,而更多的像是有限状态机。但这些系统很复杂,并且具有自适应性。类似《Black & White》的游戏采用了强化学习技术。我认为这是到目前为止游戏中最复杂的人工智能应用案例。不过到2004至2005年,很明显游戏行业走上了与90年代不同的发展方向。90年代的游戏很有趣,具有创新性。当你想到一个点子时,就可以将其开发出来。而到00年代,游戏更强调图像、内容IP,类似FIFA的游戏大行其道。因此,游戏行业不再有趣。
在游戏行业,我做了能做的所有一切,在成立DeepMind之前我需要收集好必要的信息。这就是神经科学。我希望从大脑解决问题的方式中获得灵感。因此,没有什么其他方式比攻读神经科学的博士学位更好。
问:这些或许是唾手可得的果实。你是否会将人工智能的技术进步应用在今天的游戏中?
哈萨比斯:我认为将会很有趣。实际上,近期EA也有人联系我,我们应该去做这件事。但现在的情况是,我们有很多事情可做!这些技术通用性很强,我愿意去做这件事,但问题是人的精力有限。目前,我们的关注重点是医疗和推荐系统,以及诸如此类的应用。但或许未来我们会去做游戏,这对我来说这形成一个闭环。实际上,在游戏中设计自适应的人工智能对手将创造一个巨大的市场。我认为,相对于为每款游戏开发新的人工智能技术,开发者会更喜欢这种模式。或许他们只需要针对每款游戏去训练通用的人工智能即可。
问:我可以想象,当你在家里打电子游戏时,相对于我,游戏中虚拟人物的表现会更让你失望。
哈萨比斯:是的,大型多人游戏和其他类似游戏总是令我感觉失望。我从来都无法真正融入游戏,因为虚拟人物看起来傻傻的。他们没有记忆,不会改变,也与环境无关。如果有学习型人工智能,那么游戏质量将提升至新的水平。
关于医疗
问:本周你谈到,人工智能未来的主要用途将是医疗、智能助理和机器人。能否详细谈谈。例如关于医疗,“沃森”已经在癌症诊断领域有过一些尝试。那么,DeepMind能带来些什么?
哈萨比斯:目前还处于起步阶段。几周前,我们宣布了与NHS(英国国民医疗系统)的合作,但我们最开始将建设支持机器学习的平台。根据我的理解,沃森与我们所做的工作有很大不同,更像是一个专家系统。因此,这是一种类型完全不同的人工智能。这类人工智能所做的是基于医疗图像的诊断,或是追踪生命指标,以及长期的“量化自我”,帮助人们养成健康的生活习惯。我认为,强化学习非常适合这一领域。
问:关于与NHS的合作,你们宣布了一款应用,但这款应用似乎没有用到太多的人工智能和机器学习技术。背后的考量是什么?NHS为何要用你们的应用,而不是其他公司的软件?
哈萨比斯:据我所知,NHS的软件相当糟糕,因此我们要做的第一步就是让软件具备21世纪的设计。这些软件并不存在于移动端,与用户目前习以为常的产品也很不相同。我认为,这令医生和护士们感到失望,也妨碍了他们的工作进度。因此,第一步是帮他们获得更实用的工具,例如可视化和基本的数据统计。我们将开发这样的工具,看看我们的状况,随后再引入更复杂的机器学习技术。
问:销售难度会有多大?很明显,在英国,医疗资金是一个持续讨论的话题。
哈萨比斯:我们目前是免费去做,因此推广难度不大。这与大部分软件公司都有所不同。目前,开发这类软件的大多是跨国公司,因此它们并不是非常关心用户。我们的开发方式更类似于创业公司,你会去倾听用户的反馈,并与他们共同设计。
关于智能手机助手
问:让我们来谈谈智能手机助手。我看到你在演讲幻灯片中贴出了一张来自电影《她》的剧照。这代表了最终目标?
哈萨比斯:不是这样。我的意思是,电影《她》是主流人群看待智能助手的一种简单方式。我们需要智能手机助手变得更智能,更好地理解环境,并对你正在从事的工作有更深的理解。目前,大部分这类系统还很简单:一旦你脱开预设的模板,它们就变得毫无用处。因此关键在于让这样的助手具有更好的适应性、灵活性,同时更强大。
问:这方面的发展需要什么样的突破?我们为何不能立即着手去做这件事?
哈萨比斯:实际上我们可以,你所需的只是不同的方法。这里再次出现了预编程和后天学习的不同。目前,许多智能手机助手针对专门的应用场景进行预编程,因此只能处理预编程范围内的逻辑。现实世界非常复杂,用户会从事各种各样难以预料的事,你不可能提前预测。DeepMind认为,实现智能的唯一方法在于从头开始学习,并确保通用性。这也是我们生存的基本法则。
问:在起步之初,AlphaGo被教给了许多棋型模式。考虑到用户的输入信息多种多样,这种技术将如何应用至智能手机?
哈萨比斯:是的,数据量很大,你可以利用数据去学习。但就AlphaGo的算法而言,我们认为可以不再规定受控的学习起点,完全放手让其自学,从零起步。我们将在未来几个月进行这样的尝试。这会花更长的时间,可能是几个月,因为不按棋谱随机下棋意味着更多的尝试和试错。但我们认为,这种纯粹依靠自学的模式是可行的。
问:出现这样的可能性是否是由于算法已发展到目前的程度?
哈萨比斯:不是的。我们之前也可以这样做。这样做不会让程序更强大,这只是为了尝试纯粹的自学,摆脱人为控制的部分。我们认为,这一算法可以在不受控的情况下运转。我们去年让人工智能去玩Atari的游戏,人工智能从像素点的研究起步,这其中没有掺杂任何人类知识。人工智能从屏幕上的随机像素开始。
问:让人工智能玩游戏更简单,这是否因为游戏中的失败条件很明显?
哈萨比斯:玩游戏更简单是因为分数更有规律。在围棋比赛中,你只能得到一个分数,这就是结束时胜负。这被称作“信度分配问题”。在围棋比赛中,你做出数百次行为,但却不知道哪一次会带来胜利或失败,因此信号强度很弱。在Atari的游戏中,你所做的大部分操作都会带来得分,因此你会有更多的信息反馈,帮你知道如何去做。
问:能否给一个时间表,即人工智能何时能给普通人使用的手机带来明显不同?
哈萨比斯:在未来2到3年里,你就会看到这些。不过,起步之初的情况可能会比较微妙,某些方面还需要改进。而在4年、5年,或是5年之后,你将看到性能的大幅提升。
关于
问:在你提到的未来所有可能性中,智能手机助手与谷歌整体的关联度最大?
哈萨比斯:是的。
问:谷歌是否暗示过你们,期望你们的技术如何融入谷歌的产品路线图,或是整体商业模式?
哈萨比斯:不,我们有很高的自由度,可以按照我们自己的意愿去优化研究进展。这是我们的使命,也是我们加入谷歌的原因。加入谷歌使我们得到加速,过去几年的情况已然如此。当然,我们会开发谷歌的许多内部产品,但这些产品都处于极早期的阶段,因此还没有到讨论的时机。我认为,智能手机助手将是非常核心的产品,而谷歌CEO桑达尔·皮查伊(Sundar Pichai)也说过,这将是谷歌未来的最核心。
问:谷歌也有Google Brain等其他项目,同时也推出了诸如Google Photos搜索等面向用户的机器学习功能。
哈萨比斯:这类技术无处不在。
问:你们是否与Google Brain有过互动,双方的关注点有没有重合之处?
哈萨比斯:我们的互补性很强,每周都会沟通。Google Brain专注于深度学习,而他们有杰出的工程师,例如杰夫·迪恩(Jeff Dean),因此他们将技术传播至公司的每个角落。这也是为何我们看到Google Photos搜索等强大产品的原因。他们的工作成果是现象级的。他们常驻加州山景城,因此与产品集团的联系更多,并采用12至18个月的研发周期,而我们更多地关注算法开发,周期通常为2到3年,且我们在起步之初并不直接关注产品。
问:谷歌对AlphaGo的支持有多重要?如果没有谷歌,你们还能不能取得这一成就?
哈萨比斯:非常重要。AlphaGo在比赛中并没有使用庞大的硬件,但我们需要大量的硬件资源去训练它,并制造多个版本,让它们在云计算平台上对弈。只有获得庞大的硬件资源才能高效地做到这一点。因此如果没有谷歌的资源,我们不可能在当前这个时间段就取得这样的成果。
关于机器人
问:关于机器人。我常驻日本,而日本自认为是机器人的精神家园。在日本,我看到机器人的用途有两方面。一方面,发那科制造了工业机器人,被用于多种场合。另一方面,我们也看到了类似软银Pepper的礼宾机器人,这些机器人有着远大的目标,但使用场景很有限。对于这一领域,你的看法是什么?
哈萨比斯:正如你所说,发那科的机器人在“肢体”上非常强大,所欠缺的是“智力”。礼宾机器人则有点类似智能助手。不过我所见到的这些机器人都经过预编程,只是按照模板做出响应。如果超出模板,那么机器人就不知所措。
问:我感觉,最显而易见的问题就是,机器学习之类的技术将如何提高机器人的能力。
哈萨比斯:这将是一种完全不同的方式。你需要从头开发,让机器人学习新东西,处理不可预期的事件。我认为,这才是在现实世界中机器人和软件与真实用户互动的方式。它们需要这类能力,从而发挥用处。因此,应当为机器人制定适当的学习路线。
问:你认为,学习型机器人短期内会有什么样的使用场景?
哈萨比斯:我们还没有太多地思考这一问题。很明显,无人驾驶汽车就是一种机器人,但目前这基本是一种狭义人工智能。不过,计算机视觉利用了学习型人工智能的某些方面,例如就采用了基于深度学习的标准计算机视觉技术。我可以肯定,日本已经在思考诸如老人看护机器人,或家政机器人之类的产品,这对社会,尤其是老龄化社会来说很有意义。
问:对于这些使用场景,基于学习的方式为何更适合?
哈萨比斯:你只要想想这些问题:为什么我们还没有这样的技术?为什么我们还不能让机器人来帮你打扫卫生?问题在于,每个人的家中布局和家具都不相同。而即使是同一所屋子,每天的状态也在改变。某些时候乱糟糟,某些时候又很整洁。因此没有任何一种方式可以对机器人进行预先编程,针对你的屋子提供解决方案。你甚至还希望加入自己的偏好,例如你希望衣服怎么叠放。这是一个非常复杂的问题。这些事对人来说很简单,但实际上这些任务相当复杂。
问:问个个人问题,你用扫地机器人吗?
哈萨比斯:我们有一个,但用处不是太大。
问:我自己有一个,确实不是非常有用。我会去看看它扫的不干净的地方,并再去打扫。因此我很好奇,我们何时会看到更先进的机器人,所谓“足够好”的转折点将于何时出现?
哈萨比斯:是的,我是说有可能。我认为,所有人都会以合理价格买一台机器人,帮他们收拾盘子洗碗。这种简单的扫地机器人很流行。实际上它们并没有任何智能性。我认为,在这一发展道路上的每一步都是有用的。
哈萨比斯:我个人不是很关注机器人。我关心的是将这样的人工智能应用至科学,推动科学更快地进步。我想看看由人工智能辅助的科学研究。届时人工智能将成为研究助手,去完成大量冗繁的工作,找出有趣的文章,在海量数据中找到数据结构,将这些信息呈现给人类专家和科学家,帮助他们更快地取得突破。几个月前,我曾向欧洲粒子物理研究所(CERN)做过一次演讲:相对于地球上的其他人,他们制造出了更多数据。我们都知道,在这些海量数据中可能会蕴藏新粒子的信息,但由于数据量太大,没有人能完成分析。因此我认为,如果某天人工智能可以参与寻找新粒子,那么将会很酷。(边策 维金)
此文由尾猿会网发布( 原文出自新浪科技)
相关内容
精彩推荐
热点新闻