为什么柯洁一局都赢不了？(2)_

人工智能的胜利

围棋的棋盘为 19x19 的网格，比国际象棋大，可能的下法（10^174）超过已知宇宙中所有原子数目的总和（10^80）。巨大的变数和可能性，让围棋棋道几乎成为一门玄学。

AlphaGo 下围棋的策略，与按人类预设剧本下棋的深蓝不同，其下棋算法没有经过人工调试，全部是靠自己“学会”的。

　　为什么柯洁一局都赢不了？

AlphaGo 的“游戏树” / 图片来源：Nature

AlphaGo 怎么“学”？答案是人工神经网络。人工神经网络是一种计算模型，可以在海量数据中找出规律。近年来，人工神经网络在人脸识别、机器翻译等领域被广泛应用。

　　为什么柯洁一局都赢不了？

如果人脸识别技术大规模应用，丁义珍就跑不了了

　　为什么柯洁一局都赢不了？

与人类神经网络类似，人工神经网络的基本单位是神经元。一个神经元可以接收多个输入，在计算后可以产生一个输出。一个神经网络有若干层，每一层由成百上千个神经元组成。A：生物神经元，B：人工神经元（左侧箭头代表多个输入，右侧箭头代表一个产生的输出），C：突触，D：人工神经网络/ 图片来源：InTechOpen

AlphaGo 使用了两种人工神经网络，一个是预测网络（policy network），一个是评估网络（value network）。预测网络用来预测对手下一步可能怎么走，评估网络则用来评估给定棋局下己方的获胜概率。

　　为什么柯洁一局都赢不了？

人工神经网络要用海量数据训练。AlphaGo 输入了至少三千万种棋局，自我博弈超过一百万次。在与李世石对决前，AlphaGo 预测对手的准确率达到 57%——超过半数的情况下，AlphaGo 能猜中对手下一步会怎么走 / 图片来源：Nature

相比深蓝，AlphaGo 采取的策略效率更高，战绩更辉煌。借助远胜于深蓝的计算能力和搜索策略，AlphaGo 搜索的深度与广度均大幅提高；深蓝要靠人工调试的算法才能战胜卡斯帕罗夫，AlphaGo 的下棋策略，却完全是靠自己在海量数据中摸索出来的。

这是真正的人工智能对职业棋手的胜利。

　　为什么柯洁一局都赢不了？

AlphaGo 的研发团队中仅有黄世杰博士（业余四段）一人会下围棋。在与李世石的对决中，黄博士代为执子。

为什么柯洁一局都赢不了

理解了 AlphaGo 怎么下棋，就不难理解为什么柯洁必输。首先，AlphaGo 的训练量、所见棋局和进步速度都远超柯洁。

AlphaGo 见过、下过的棋，以百万计。柯洁的训练量，我们做最乐观的粗略估算，也难以超过五万局。

　　为什么柯洁一局都赢不了？

根据启蒙老师李守胜的说法，“柯洁可以说还在娘胎里的时候，就是听着围棋声长大的”。我们假设 1997 年出生的柯洁，从负一岁就开始下棋，每天 24 小时不眠不休，每局 4 小时，在整整 21 年中，也只能下不到 5 万局。

需要指出的是，人类对棋谱的利用率远超人工智能。职业棋手通过几十局棋谱，就能大致摸清对手棋路。人工智能却需要至少数以万计的棋谱，才有可能发现其中规律。

而且，并非数据“喂”得越多，下棋水平越高。输入海量数据后，人工智能仍不得法的情况也很常见。

不过，一旦找到了规律，人工智能就进步神速。AlphaGo 只用两年，就从零起步登顶世界第一，手下败将包括李世石、聂卫平、柯洁。

这次与柯洁对弈的 AlphaGo，也不同于去年大战李世石的版本。AlphaGo 有分布式版与单机版两个版本，去年与李世石对决，AlphaGo 还需动用分布式版全力以赴，今次只需单机版就能轻取棋艺更高的柯洁。两个版本的计算能力差距悬殊，单机版运行在 48 个CPU 和 8 个 GPU 上，分布式版运行在 1202 个 CPU 和 176 个 GPU 上。

或者说，对李世石是群殴，对柯洁是单挑。

2017年初，AlphaGo 化名 Master，在在线快棋对决中，横扫中日韩顶尖棋手，获 60 胜 0 负 1 平。唯一一次平局是因为对手掉线，比赛不得不提前终止。击败聂卫平后，代为执子的黄世杰博士在对话框中敲出“谢谢聂老师”。

柯洁有没有可能通过研究 AlphaGo 的棋谱找到对手的弱点呢？可能性非常小。时至今日，AlphaGo 的围棋下法已经超出了人类经验和理解力范畴。理论上，大家都知道，AlphaGo 是按概率下棋。但实战中，棋手猜不出 AlphaGo 下一步会怎么走，AlphaGo 却不仅猜得中，还算得出各种下法胜算几何。

数千年来，人类学习围棋的方式更多是依靠经验。这种经验可能来自前人棋谱，也可能来自长年累月的对弈训练出的“直觉”。

这种经验，既成就了柯洁，也束缚了柯洁。它让柯洁可以站在前人的肩膀上往更高处攀登，但也局限了他对围棋的理解和创新。

当看到 AlphaGo 下出棋论上的“臭棋”，却所向披靡时，柯洁便会发出文章开头那样的惊叹，认为人类几千年来在围棋上的所有积累都化为乌有了。

尽管柯洁试图跳出这种局限，但不论他研究 AlphaGo 的棋谱，还是和其他人工智能下棋，在 AlphaGo 强大的运算和预测能力面前，这样的努力都无异于大海捞针。

AlphaGo 的胜利，虽然难免给柯洁个人造成不快，但对更多人来说，体现的是意义非凡的技术进步。

如果把“寻找围棋的至高真理”看做一个悬疑千年未解的难题，将职业棋手和人工智能看做人类解决这个难题的不同尝试，AlphaGo 的胜利显然意义非凡，仿佛一百年前拖拉机的成功问世。

转载请注明出处。