2
人工智能的胜利
围棋的棋盘为 19x19 的网格,比国际象棋大,可能的下法(10^174)超过已知宇宙中所有原子数目的总和(10^80)。巨大的变数和可能性,让围棋棋道几乎成为一门玄学。
AlphaGo 下围棋的策略,与按人类预设剧本下棋的深蓝不同,其下棋算法没有经过人工调试,全部是靠自己“学会”的。
AlphaGo 的“游戏树” / 图片来源:Nature
AlphaGo 怎么“学”?答案是人工神经网络。人工神经网络是一种计算模型,可以在海量数据中找出规律。近年来,人工神经网络在人脸识别、机器翻译等领域被广泛应用。
如果人脸识别技术大规模应用,丁义珍就跑不了了
与人类神经网络类似,人工神经网络的基本单位是神经元。一个神经元可以接收多个输入,在计算后可以产生一个输出。一个神经网络有若干层,每一层由成百上千个神经元组成。A:生物神经元,B:人工神经元(左侧箭头代表多个输入,右侧箭头代表一个产生的输出),C:突触,D:人工神经网络/ 图片来源:InTechOpen
AlphaGo 使用了两种人工神经网络,一个是预测网络(policy network),一个是评估网络(value network)。预测网络用来预测对手下一步可能怎么走,评估网络则用来评估给定棋局下己方的获胜概率。
人工神经网络要用海量数据训练。AlphaGo 输入了至少三千万种棋局,自我博弈超过一百万次。在与李世石对决前,AlphaGo 预测对手的准确率达到 57%——超过半数的情况下,AlphaGo 能猜中对手下一步会怎么走 / 图片来源:Nature
相比深蓝,AlphaGo 采取的策略效率更高,战绩更辉煌。借助远胜于深蓝的计算能力和搜索策略,AlphaGo 搜索的深度与广度均大幅提高;深蓝要靠人工调试的算法才能战胜卡斯帕罗夫,AlphaGo 的下棋策略,却完全是靠自己在海量数据中摸索出来的。
这是真正的人工智能对职业棋手的胜利。
AlphaGo 的研发团队中仅有黄世杰博士(业余四段)一人会下围棋。在与李世石的对决中,黄博士代为执子。
3
为什么柯洁一局都赢不了
理解了 AlphaGo 怎么下棋,就不难理解为什么柯洁必输。首先,AlphaGo 的训练量、所见棋局和进步速度都远超柯洁。
AlphaGo 见过、下过的棋,以百万计。柯洁的训练量,我们做最乐观的粗略估算,也难以超过五万局。
根据启蒙老师李守胜的说法,“柯洁可以说还在娘胎里的时候,就是听着围棋声长大的”。我们假设 1997 年出生的柯洁,从负一岁就开始下棋,每天 24 小时不眠不休,每局 4 小时,在整整 21 年中,也只能下不到 5 万局。
需要指出的是,人类对棋谱的利用率远超人工智能。职业棋手通过几十局棋谱,就能大致摸清对手棋路。人工智能却需要至少数以万计的棋谱,才有可能发现其中规律。
而且,并非数据“喂”得越多,下棋水平越高。输入海量数据后,人工智能仍不得法的情况也很常见。
不过,一旦找到了规律,人工智能就进步神速。AlphaGo 只用两年,就从零起步登顶世界第一,手下败将包括李世石、聂卫平、柯洁。
这次与柯洁对弈的 AlphaGo,也不同于去年大战李世石的版本。AlphaGo 有分布式版与单机版两个版本,去年与李世石对决,AlphaGo 还需动用分布式版全力以赴,今次只需单机版就能轻取棋艺更高的柯洁。两个版本的计算能力差距悬殊,单机版运行在 48 个CPU 和 8 个 GPU 上,分布式版运行在 1202 个 CPU 和 176 个 GPU 上。
或者说,对李世石是群殴,对柯洁是单挑。
2017年初,AlphaGo 化名 Master,在在线快棋对决中,横扫中日韩顶尖棋手,获 60 胜 0 负 1 平。唯一一次平局是因为对手掉线,比赛不得不提前终止。击败聂卫平后,代为执子的黄世杰博士在对话框中敲出“谢谢聂老师”。
柯洁有没有可能通过研究 AlphaGo 的棋谱找到对手的弱点呢?可能性非常小。时至今日,AlphaGo 的围棋下法已经超出了人类经验和理解力范畴。理论上,大家都知道,AlphaGo 是按概率下棋。但实战中,棋手猜不出 AlphaGo 下一步会怎么走,AlphaGo 却不仅猜得中,还算得出各种下法胜算几何。
数千年来,人类学习围棋的方式更多是依靠经验。这种经验可能来自前人棋谱,也可能来自长年累月的对弈训练出的“直觉”。
这种经验,既成就了柯洁,也束缚了柯洁。它让柯洁可以站在前人的肩膀上往更高处攀登,但也局限了他对围棋的理解和创新。
当看到 AlphaGo 下出棋论上的“臭棋”,却所向披靡时,柯洁便会发出文章开头那样的惊叹,认为人类几千年来在围棋上的所有积累都化为乌有了。
尽管柯洁试图跳出这种局限,但不论他研究 AlphaGo 的棋谱,还是和其他人工智能下棋,在 AlphaGo 强大的运算和预测能力面前,这样的努力都无异于大海捞针。
AlphaGo 的胜利,虽然难免给柯洁个人造成不快,但对更多人来说,体现的是意义非凡的技术进步。
如果把“寻找围棋的至高真理”看做一个悬疑千年未解的难题,将职业棋手和人工智能看做人类解决这个难题的不同尝试,AlphaGo 的胜利显然意义非凡,仿佛一百年前拖拉机的成功问世。
转载请注明出处。