首页 > 国内新闻

AlphaGo之父:下个版本会让电脑从零开始学围棋

文章作者:来源:www.50x15.com时间:2019-12-03



DeepMind创始人Hassabis

3月9日,谷歌人工智能AlphaGo击败韩国棋手李世石,引起巨大轰动。美国科技媒体《边缘》对阿尔法围棋(AlphaGo)背后DeepMind的联合创始人戴密斯哈萨比斯进行了长时间采访。哈萨比斯谈到了他对人工智能未来的看法。

以下是文章的全文:

DeepMind的阿尔法围棋打败了韩国传奇棋手李世石,点燃了之前对人工智能的热情空 然而,这家谷歌子公司的AlphaGo计划远远超出了它本身甚至它也不是焦点。 作为DeepMind的联合创始人,戴密斯哈萨比斯本周早些时候表示,DeepMind希望做出“聪明的解决方案”,对此他有一些想法。

哈萨比斯以一种不同寻常的方式实现了他的人生目标,但现在回想起来,这是一种完美的方式。 哈萨比斯是国际象棋天才,在智力奥运会上赢得了五次冠军。 他年轻时声名鹊起,为英国牛蛙和狮子头游戏开发公司工作,致力于开发类似“主题公园”和“黑白”的人工智能游戏。后来他建立了自己的工作室。 哈萨比斯在2000年代中期离开游戏行业,完成了他的神经科学博士学位,并于2010年共同创立了DeepMind。

阿尔法围棋第一次战胜李世石后的清晨,哈萨比斯坐下来采访了《边缘》。 当他走进房间时,他评论了首尔四季酒店的灯光设置,给人一种非常温暖友好的感觉。 当谷歌的一名代表告诉他,昨晚有3300篇韩国媒体文章报道了他时,他显然显得非常惊讶。 “这太不可思议了,不是吗?”他说,“看到一些深奥难懂的东西变得流行很有趣。” “

除了AlphaGo,我们的谈话还涉及到视频游戏、下一代智能手机助手、DeepMind在谷歌中的角色、机器人、人工智能如何帮助研究等

注意:为了便于阅读,本次采访的内容略有改动。

问:《边缘》记者萨姆比福德:你如何描述昨天发生在那些不懂人工智能或不了解人工智能的人身上的文化共鸣?

哈萨比斯:关于这些,我想说什么 围棋一直是完整信息游戏的巅峰 它的可能性比象棋更复杂,所以它一直是人工智能领域的一大挑战,尤其是在“深蓝”之后 你知道,即使我们已经做了很多努力,我们仍然没有走得太远。 蒙特卡洛树搜索(Monte Carlo tree search)十年前是一项伟大的创新,但我认为我们已经成功地使用AlphaGo将“直觉”引入神经网络。如果你想这样称呼它,正是这些直觉让一些人成为顶级玩家。 令我惊讶的是,即使是现场评论迈克雷蒙也很难找到结局。他是一名专业的九段棋手。这说明你写围棋的“估值函数”有多难。

q:当你看到AlphaGo的特殊举动时,你会感到惊讶吗?

哈萨比斯:是的 我们很震惊,我想李世石也是,从他的表情可以看出。 阿尔法戈(AlphaGo)的举动深深渗透到了李世石的领地。 我认为这是一个相当出乎意料的举动

问:是因为侵略吗?

哈萨比斯:嗯,这是侵略性和大胆!此外,它还在比赛中扮演了李世石。 李世石以好战着称。这是他传达的,也是我们期待的。 比赛开始时,他在整个棋盘上战斗,但没有一个是真的。 传统的围棋程序在处理这种情况时非常薄弱。 他们在本地计算方面并不差,但是当他们需要全局视图时,他们就非常弱。

问:这场比赛的主要原因之一是评估阿尔法狗的能力,不管输赢。 昨晚你学到了什么?

哈萨比斯:嗯,我想我们已经了解到,我们已经沿着这条路走了很长一段路,没有超出我们的期望,而是达到了我们的期望。 我们想告诉公众,我们认为比赛将在55年后举行 我认为这可能仍然是正确的。这里什么都可能发生。我知道李世石今天回来时会采取不同的策略。 因此,我认为找出对手的策略会很有趣。

刚才我谈到人工智能的含义,回答了你的第一个问题 我想告诉你的另一件事是,我们不同于深蓝。 深蓝是一个“手动”程序,程序员从国际象棋规则中提取信息并获得灵感。 我们的阿尔法狗有学习的能力。它通过实践和学习获得知识,这更像一个人。

问:如果阿尔法狗继续以这种方式赢得系列赛,接下来会发生什么?将来会有人工智能游戏决斗吗?

哈萨比斯:我认为围棋是完整信息游戏的巅峰 当然,我们还有其他顶级球员可以打 此外,其他游戏非常难,比如无限注德州扑克。 多人游戏还有其他挑战,因为它是一个不完整的信息游戏。 同样显而易见的是,在玩《星际争霸》这样的游戏时,人类比电脑强。 在信息不完全的世界里,战略游戏需要高水平的战略能力。 围棋的问题是显而易见的。你可以看到板上的一切,所以对电脑来说更容易。

问:(人工智能)你个人对玩这些游戏有兴趣吗?

哈萨比斯:也许吧 我们只对研究项目主线内的事情感兴趣。 所以DeepMind的目的不仅仅是玩游戏,尽管它非常有趣和令人兴奋。 你知道,我喜欢玩游戏。我以前写过电脑游戏。 然而,它只是作为一个测试平台来尝试编写我们的算法思想,并测试它能有多高以及它能玩得多好。这是一种非常有效的方法。 最后,我们希望将其应用于现实世界中的重大问题。

问:20世纪90年代末,当我在一本电脑杂志上读到你的名字时,我在英国长大。你的名字经常和游戏联系在一起。 当我第一次听说DeepMind并看到你的名字时,我想,“这是一个完美的匹配。” “你以前在游戏行业的职业经历对你现在的工作有何影响?

哈萨比斯:像深度思维这样的东西一直是我的最终目标。 从某种意义上说,我已经计划了20多年。 如果你从这个角度来看,也就是说,我所做的一切就是最终进入人工智能领域,那么你会发现我的选择是合理的。 如果你熟悉我在牛蛙和其他公司的工作,那么你就会知道人工智能是我所做一切的核心。 显然,皮特莫利纽克斯的游戏也是人工智能游戏。

当我16到17岁的时候,通过《星际争霸》的发展,我意识到如果我继续发展人工智能,那么人工智能将会发挥巨大的力量。 我们已经卖出了数百万份,许多人喜欢这个游戏。 正是因为人工智能的存在,这种游戏才能够适应玩家。 然后我们继续发展,我也试图在我整个游戏行业的职业生涯中继续发展这项技术。

然后,我退出游戏行业,回到学术界研究神经科学。 因为在21世纪中期,我觉得很难通过游戏的“后门”进行人工智能研究,因为游戏出版商只想要游戏

q:游戏是当时人工智能唯一明显的应用吗?

哈萨比斯:是的,我想是的 事实上,我认为,当时我们正在用极其先进的技术开发人工智能。 我想说的是,学术界仍处于20世纪90年代,所有新技术尚未大规模推广应用,如神经网络、深度学习和强化学习。 因此,游戏中存在最好的人工智能技术

当时的技术不同于我们目前正在开发的学习人工智能,更像是一个有限状态机。 然而,这些系统是复杂的和自适应的 像《主题公园》这样的游戏使用强化学习技术。 我认为这是迄今为止游戏中最复杂的人工智能应用案例 然而,从2004年到2005年,游戏产业显然已经走上了与上世纪90年代不同的方向。 20世纪90年代的游戏非常有趣和创新。 当你想出一个主意时,你可以发展它。 在20世纪,游戏更加强调图像和内容知识产权,类似国际足联的游戏变得流行起来。 因此,游戏产业不再有趣。

在游戏行业,我已经尽力了,我需要在设置DeepMind之前收集必要的信息。 这是神经科学 我希望从大脑解决问题的方式中获得灵感。 因此,没有比攻读神经科学博士学位更好的方法了。

-