社会焦点

为什么柯洁一局都赢不了?(2)

字号+ 作者: 来源: 2017-05-26

2 人工智能的胜利 围棋的棋盘为 19x19 的网格,比国际象棋大,可能的下法(10^174)超过已知宇宙中所有原子数目的总和(10^80)。巨大的变数和可能性,让围棋棋道几乎成为一门玄学。 AlphaGo 下围棋的策略,与按人

  2

人工智能的胜利

围棋的棋盘为 19x19 的网格,比国际象棋大,可能的下法(10^174)超过已知宇宙中所有原子数目的总和(10^80)。巨大的变数和可能性,让围棋棋道几乎成为一门玄学。

AlphaGo 下围棋的策略,与按人类预设剧本下棋的深蓝不同,其下棋算法没有经过人工调试,全部是靠自己“学会”的。

  为什么柯洁一局都赢不了?

AlphaGo 的“游戏树” / 图片来源:Nature

AlphaGo 怎么“学”?答案是人工神经网络。人工神经网络是一种计算模型,可以在海量数据中找出规律。近年来,人工神经网络在人脸识别、机器翻译等领域被广泛应用。

  为什么柯洁一局都赢不了?

如果人脸识别技术大规模应用,丁义珍就跑不了了

  为什么柯洁一局都赢不了?

与人类神经网络类似,人工神经网络的基本单位是神经元。一个神经元可以接收多个输入,在计算后可以产生一个输出。一个神经网络有若干层,每一层由成百上千个神经元组成。A:生物神经元,B:人工神经元(左侧箭头代表多个输入,右侧箭头代表一个产生的输出),C:突触,D:人工神经网络/ 图片来源:InTechOpen

AlphaGo 使用了两种人工神经网络,一个是预测网络(policy network),一个是评估网络(value network)。预测网络用来预测对手下一步可能怎么走,评估网络则用来评估给定棋局下己方的获胜概率。

  为什么柯洁一局都赢不了?

人工神经网络要用海量数据训练。AlphaGo 输入了至少三千万种棋局,自我博弈超过一百万次。在与李世石对决前,AlphaGo 预测对手的准确率达到 57%——超过半数的情况下,AlphaGo 能猜中对手下一步会怎么走 / 图片来源:Nature

相比深蓝,AlphaGo 采取的策略效率更高,战绩更辉煌。借助远胜于深蓝的计算能力和搜索策略,AlphaGo 搜索的深度与广度均大幅提高;深蓝要靠人工调试的算法才能战胜卡斯帕罗夫,AlphaGo 的下棋策略,却完全是靠自己在海量数据中摸索出来的。

这是真正的人工智能对职业棋手的胜利。

  为什么柯洁一局都赢不了?

AlphaGo 的研发团队中仅有黄世杰博士(业余四段)一人会下围棋。在与李世石的对决中,黄博士代为执子。

  3

为什么柯洁一局都赢不了

理解了 AlphaGo 怎么下棋,就不难理解为什么柯洁必输。首先,AlphaGo 的训练量、所见棋局和进步速度都远超柯洁。

AlphaGo 见过、下过的棋,以百万计。柯洁的训练量,我们做最乐观的粗略估算,也难以超过五万局。

  为什么柯洁一局都赢不了?

根据启蒙老师李守胜的说法,“柯洁可以说还在娘胎里的时候,就是听着围棋声长大的”。我们假设 1997 年出生的柯洁,从负一岁就开始下棋,每天 24 小时不眠不休,每局 4 小时,在整整 21 年中,也只能下不到 5 万局。

需要指出的是,人类对棋谱的利用率远超人工智能。职业棋手通过几十局棋谱,就能大致摸清对手棋路。人工智能却需要至少数以万计的棋谱,才有可能发现其中规律。

而且,并非数据“喂”得越多,下棋水平越高。输入海量数据后,人工智能仍不得法的情况也很常见。

不过,一旦找到了规律,人工智能就进步神速。AlphaGo 只用两年,就从零起步登顶世界第一,手下败将包括李世石、聂卫平、柯洁。

这次与柯洁对弈的 AlphaGo,也不同于去年大战李世石的版本。AlphaGo 有分布式版与单机版两个版本,去年与李世石对决,AlphaGo 还需动用分布式版全力以赴,今次只需单机版就能轻取棋艺更高的柯洁。两个版本的计算能力差距悬殊,单机版运行在 48 个CPU 和 8 个 GPU 上,分布式版运行在 1202 个 CPU 和 176 个 GPU 上。

或者说,对李世石是群殴,对柯洁是单挑。

2017年初,AlphaGo 化名 Master,在在线快棋对决中,横扫中日韩顶尖棋手,获 60 胜 0 负 1 平。唯一一次平局是因为对手掉线,比赛不得不提前终止。击败聂卫平后,代为执子的黄世杰博士在对话框中敲出“谢谢聂老师”。

柯洁有没有可能通过研究 AlphaGo 的棋谱找到对手的弱点呢?可能性非常小。时至今日,AlphaGo 的围棋下法已经超出了人类经验和理解力范畴。理论上,大家都知道,AlphaGo 是按概率下棋。但实战中,棋手猜不出 AlphaGo 下一步会怎么走,AlphaGo 却不仅猜得中,还算得出各种下法胜算几何。

数千年来,人类学习围棋的方式更多是依靠经验。这种经验可能来自前人棋谱,也可能来自长年累月的对弈训练出的“直觉”。

这种经验,既成就了柯洁,也束缚了柯洁。它让柯洁可以站在前人的肩膀上往更高处攀登,但也局限了他对围棋的理解和创新。

当看到 AlphaGo 下出棋论上的“臭棋”,却所向披靡时,柯洁便会发出文章开头那样的惊叹,认为人类几千年来在围棋上的所有积累都化为乌有了。

尽管柯洁试图跳出这种局限,但不论他研究 AlphaGo 的棋谱,还是和其他人工智能下棋,在 AlphaGo 强大的运算和预测能力面前,这样的努力都无异于大海捞针。

AlphaGo 的胜利,虽然难免给柯洁个人造成不快,但对更多人来说,体现的是意义非凡的技术进步。

如果把“寻找围棋的至高真理”看做一个悬疑千年未解的难题,将职业棋手和人工智能看做人类解决这个难题的不同尝试,AlphaGo 的胜利显然意义非凡,仿佛一百年前拖拉机的成功问世。

转载请注明出处。


1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 世界上最安静的房间体验感最后是被自己吓疯的,幽闭恐惧症者慎入

    世界上最安静的房间体验感最后是被自己吓疯的,幽闭恐惧症者慎入

  • 世界上第一个网站啥样?中国第一个网站是啥?有人能关掉互联网吗?

    世界上第一个网站啥样?中国第一个网站是啥?有人能关掉互联网吗?

  • c罗身价有多少钱在世界排名多少?身价最贵的球员是谁

    c罗身价有多少钱在世界排名多少?身价最贵的球员是谁

  • 全世界胖美女图片就算胖也漂亮 全世界最胖的女人是谁照片

    全世界胖美女图片就算胖也漂亮 全世界最胖的女人是谁照片