2018年8月12日星期日

AlphaGo与人类的恩怨情仇(三):巅峰之战

2016年1月27日,AlphaGo登上《自然》封面。同日,DeepMind宣布,将在同年3月挑战韩国棋手李世乭九段。

李世乭,一代棋王,世界大赛十四冠(注1:DeepMind采用十八冠的说法,计入了亚洲杯电视快棋赛的冠军)。AlphaGo,第一个分先击败职业棋手的围棋AI。命运的齿轮就此开始转动。

人机大战,一个能抓住所有人眼球的话题。棋手和软件工程师,利益相关的两个群体针对人机大战争论不休,观点泾渭分明。IT从业者普遍对AlphaGo获胜前景乐观,因为AlphaGo采用的深度学习技术近年来攻无不克。而棋手们在看过AlphaGo对战樊麾的棋谱之后,认为她只不过是准职业水平。尽管从战胜樊麾到挑战李世乭,AlphaGo尚有五个月时间,但多数棋手不认为五个月的训练足以让AlphaGo跨越从弱职业到顶级棋手的天堑。两派观点都非常坚定,认为自己这边赢定了,却不知幕后的暗流涌动。

挑战赛的发布会上,李世乭九段表现出谨慎的乐观,认为自己将以5比0或4比1的比分胜出,重点是尽可能不要输掉一局。而DeepMind首席执行官哈萨比斯则表示,胜负将会是五五之数。纪录片《AlphaGo》揭示了哈萨比斯所说“五五开”的真实含义。

樊麾在与AlphaGo鏖战之后,回到DeepMind负责测试。3月份之前,AlphaGo飞速进步,表面实力已超过顶尖棋手。然而,樊麾在反复测试之后,发现了大问题。在少数局面下,AlphaGo不能正确评估当前形势,导致低级错误。


赛前的一盘测试棋,AlphaGo再次犯下低级错误。项目负责人大卫·席尔瓦(David Silver)在例会上说,如果正式比赛中出现这个错误,我们在公众面前就尴尬了。席尔瓦询问黄士杰博士有无办法解决,黄博士略带尴尬地笑称:“我正在努力解决。”

这确实不是一个简单的bug。直到出发前三天,整个团队仍在加班加点寻找解决方案,却无结果。哈萨比斯带领的团队,只能以有缺陷的AlphaGo出征了。

人们常说,李世乭面对的是一个冷冰冰的对手,无法与之交流心灵。不过,李世乭可以与哈萨比斯交心。赛前数日,哈萨比斯与李世乭通过翻译和视频交流。哈萨比斯曾是西洋棋神童,两人有共同话题。但李世乭最关心的事,当然是AlphaGo的实力到了何等地步。哈萨比斯称不能透露具体情况,不过AlphaGo确实已有长足进步,相信会是精彩的对决。


李世乭在与DeepMind签约之时,并未效仿“深蓝”故事,要求测试对局。大概当时李世乭并未意识到AlphaGo的巨大潜力。等到赛前,李世乭发现自己的对手深不可测,却再没有侦查的机会。李世乭为自己的轻率付出了代价,他只能在迷雾中作战了。

第一局

韩国首尔时间3月9日下午1时,巅峰对决启动。坐在李世乭对面的,不是机械手,而也是一位棋手。黄士杰,AlphaGo项目的最初开发者、主要贡献者,台湾业余6段棋手。黄博士安静、沉稳,符合大众对软件工程师的一贯印象,也符合一名棋手的形象。若不是黄博士面前有一台电脑,没人会怀疑这只是一场普通的围棋赛。


李世乭猜得黑棋先行。开局阶段,李世乭看上去比较轻松,落子不假思索。而AlphaGo则显得相当谨慎,每一步棋都思考了接近一分钟。棋局很快进入了不同寻常的方向。


全局的第7手,李世乭在棋盘右边斜拆四。黑棋1、3、5、7前四手的组合,在棋谱中不曾出现。李世乭或许是认为AlphaGo针对人类布局存有应对策略,便另辟蹊径,想考验对手。试探对手的代价是,这步棋本身不合棋理。按照一般布局理论,黑棋此时当在棋盘上边行棋,如A、B等处,避免左上一子孤军奋战。AlphaGo也持相同观点。


右上角简单处理之后,AlphaGo将黑棋上边二子隔开,取得了局部战斗的主动权。下到这里,李世乭慢了下来,棋局似乎不如预想的顺利。24、26又是令人惊艳的组合拳,各方解说无不赞叹AlphaGo的力量。落下第27手后,李世乭轻轻摇了摇头。李世乭有意要和AlphaGo掰掰手腕,但这不是最好的时机。被白棋28手切断以后,局部黑棋陷入被动。之后,黑棋勉强处理好被分割的两块棋,却免不了被对手占点便宜。棋至中盘,白棋已建立了一定优势。


由于棋局不利,李世乭表现得愈加紧张。第67手时,李世乭捻起一枚棋子,犹犹豫豫想落在A位,终究没有落下,讪讪地收回右手,摇了摇头。手持棋子在棋盘上晃来晃去,俗称“小猫钓鱼”。若是棋童这么下棋,要被老师打手心的。不过,若是李世乭确实落子在A位,事情会更糟糕,这盘棋李世乭就已经输了。在场的韩国解说称:“最令人担心的事发生了,李九段在怀疑自己,好像还有一点震恐。”


AlphaGo似乎已接近胜利,局面却又发生了变化。白棋把左下角广阔的空间让给黑棋,随后又弈出88虎的失着。黑91割下一子之后,将下方大空尽数收入囊中。

棋局至此,多数解说判断李世乭已逆转局面,取得优势。AlphaGo自评的即时胜率也略微下降,但仍在70%以上。就在各家媒体的演播厅的气氛一片乐观之时,AlphaGo祭出了决定性的一着。


白102,打入。光芒万丈的一手棋。白棋精确地撬开了右边黑棋防线上的唯一空隙。长考7分钟之后,李世乭并未找到歼灭入侵者的手段,无奈妥协。白棋金蝉脱壳,吃掉右上三枚黑子后扬长而去,确立胜势。

临近终局,解说们一遍又一遍地点目,只发现黑棋要输。在乐视演播厅,陈盈初段甚至不敢相信柯洁的判断,以为听错了。棋手们不愿意相信,李世乭也不愿意相信,但不得不接受事实。第186手之后,李世乭将一枚白子置于棋盘上,示意认输。欢呼雀跃的是AlphaGo团队,其他人则反复念叨一个词,“难以置信”。

首局比赛在全球有不少于八千万人收看直播,其中六千万来自中国。赛后,柯洁发微博说,“就算阿法狗战胜了李世石,但它赢不了我”。一石激起千层浪,数百万人由此认识了一位最年轻的世界第一。当年的柯洁还不是网红,也许他自己都没有预料到这条微博将产生的深远影响力。柯洁只是觉得,这一局AlphaGo表现出的水平不如自己。孟泰龄六段更为激进,认为他能让AlphaGo一先。由于AlphaGo的发挥看上去并不完美,棋手们在此时仍然低估了她。

第二局

3月10日,第二局。AlphaGo执黑棋,李世乭执白棋。

执黑先行的一方掌握着布局走向,AlphaGo很快将棋局引向了不同寻常的方向。第13手,按照定式,黑棋应在左边□处拆边。实战黑棋竟然在右边拆边,完成中国流布局。


此时,棋手们的第一感觉是,既然黑棋拒绝完成定式,那么白棋应当在左边B位拆边,惩罚黑棋的脱先。实际上,AlphaGo的预想图也是白棋走在B点,然后黑棋走在下方A位,将右下半块棋盘连成一片。出乎意料,李世乭选择走在A位,有意破坏黑棋的意图。观众尚未从黑13的震撼中缓过来,又看到黑棋第15手更令人吃惊的表演。


黑15刺,行内人称之为“俗手”。所谓俗手,即在不恰当时机履行的先手权利。此处黑15刺与白16接的交换,曾被认为是黑棋的先手权利,白棋无法反抗。只是黑棋不应过早定型,失去很多潜在变化。AlphaGo显然不这么看。它认为,黑15与白16交换,黑棋实实在在地获得了便宜,白棋应当考虑反击。赛后复盘,柯洁指出,白棋应当在△处反击。近期问世的AlphaGo教学工具与柯洁达成共识,并认为若白棋反击,黑15的效果不好,不如直接在左下角动手。

本局之后,职业棋手在比赛中纷纷效仿黑15的俗手,且研究出几种新的应对。在此局的棋盘上,李世乭只是笨重地接上。AlphaGo认为自己得利,且在左上角无后顾之忧,转向左下角。棋局平稳地推进至36手,李世乭出门吸烟小憩。黑37手,五路肩冲。AlphaGo弈出本局中最漂亮的一手棋。


在三千年围棋史上,除了武宫正树以外,没有人会下五路肩冲。其原因不难理解:比如此局面,白棋只需在B位贴住,即可确保整条上边全部姓白。五路肩冲等于送对手在四路围空,效率甚高。AlphaGo的预想图也是白棋走B位,然后黑棋左一路跳。这样一来,黑棋在中腹与左边△数子建立联系,全盘一体。五路肩冲体现了AlphaGo的创造力,给人以极大视觉冲击。但这并不是制胜的一着,甚至不见得比其它选择更好。在白棋走36之前,黑棋在考虑走下方□处的吊,直至36手之后才临时想到实战的五路肩冲。如果李世乭按照AlphaGo的预想图施工,棋局仍然均衡,胜负漫长。

纪录片《AlphaGo》用重点描绘了这一步棋的前前后后。樊麾说,他非常期待李世乭吸烟归来之后,看到黑棋五路肩冲时的表情。李世乭坐下后,先是惊愕地皱眉,然后微微一笑,接着陷入了沉思。笔者参加了《AlphaGo》的首映式,记得镜头切换到李世乭的脸上的时候,全场爆笑。在场的大部分观众不懂围棋,却也和棋手产生了共鸣。

李世乭思考了十二分钟,最终选择不走寻常路,从另一边(A位)贴出,破坏黑棋的全局联系。从局后分析来看,这不是一步好棋。李世乭在本局中始终选择破坏对手的意图,不管这个选择对自己是否有利。这可能是与人类对局时的思维惯性:打破对手的意图,就能干扰对手的心情。但AlphaGo没有心情。李世乭没有按预想图走,AlphaGo只会更“高兴”,因为黑棋的胜率又涨了。

棋局才进行了短短三十多手,AlphaGo就下出了三手人类看来不可思议的棋。李世乭与对手的围棋价值观,看来有很大分歧。面对价值观上的分歧,自信者的做法应该是坚持自己的判断,避免行棋前后矛盾。可是,李世乭的对手太特殊、太神秘,以致于李世乭不可避免地怀疑,是不是对手的判断就是比我的判断正确。于是,李世乭在本局中的选择,可以说完全放弃了自己的判断,相信对手的判断,因而刻意去干扰对手的意图。重压之下,李世乭做不到那个棋盘前那个自信、沉稳的自己。

此后,AlphaGo在左下强硬地出动残子。这步棋在AlphaGo的复盘中被自评为本局唯一失误,给了李世乭反击的机会。可惜,李世乭在局部没有下出最强手段,左下定型双方平分秋色。


李九段大概是觉得左下的结果满意,产生优势意识。之后的几手棋,白棋下得相当保守,价值不大。等到李世乭发觉形势不利之时,白80选择打入黑阵拼搏,为时已晚。黑81以下轻松化解白棋攻击,确立胜势。白棋坚持到211手,随后投子认输。

赛后,李世乭说,“昨天我惊讶于AlphaGo的出色表现,但今天,我完全说不出话来。” 整个新闻发布会的现场弥漫着忧愁、郁闷,仿佛是整个人类输掉了这一盘棋。即使AlphaGo团队成员也不似昨天获胜后的兴奋。零比二,李世乭被逼到了悬崖边上。面对深不可测的敌手,李世乭还有机会吗?

引文链接

“AlphaGo与人类的恩怨情仇” 全文系列:()()()()()()结束。

没有评论:

发表评论