2018年8月14日星期二

人类与AlphaGo的恩怨情仇(五):最后一战

AlphaGo与李世乭的挑战赛,乃是围棋界空前绝后的大事件。世界各国主流媒体争相报导,将其列入各种“年度十大”的榜单。欧、美等地围棋用具脱销,围棋俱乐部门庭若市,数百万人认识了围棋。不过,AlphaGo受到的大部分关注还是来自围棋的母国——中国。聂卫平席卷中日擂台赛已过去近三十年,围棋再次回到大众视野。有的人问,中国人发明的围棋,为什么谷歌选择了一个韩国人做对手?略懂一点的人也疑惑,世界第一不是柯洁吗,为何被选中的是李世乭?

谷歌筹备与李世乭的巅峰之战是在2015年末。其时,柯洁的崛起尚在进行时,棋界群龙无首。李世乭作为上一个世代的王者,在所有高手中仍位列三甲,雀屏中选合乎情理。然而,几个月的时间,棋界风云变幻,柯洁战胜李世乭加冕三冠王,成为公认的霸主。谷李五番棋前后,Goratings等级分因哈萨比斯等人的频繁引用而声名鹊起。AlphaGo因四比一胜李世乭登上排行榜第二位,竟仍排在柯洁后面。某谷歌员工转发排行榜,并喊话柯洁“你准备好了吗”,被认为是谷歌向柯洁宣战,在社交网络上疯转。尽管最后被证明是该员工的个人行为,吃瓜群众对柯洁与AlphaGo终极对弈的期待可见一斑。柯洁本人求战欲望强烈,棋院不吝支持,似乎万事俱备,只欠东风。

可惜,时间不在柯洁这边。谷李大战之后,谷歌团队全情投入了AlphaGo的升级工作。当时流行的观点是,AlphaGo具有强大的自我学习能力,进步飞快,一两个月就可以把柯洁远远甩在身后。这算是说对了一半。背后的另一半,则是谷歌团队的不懈努力。数月之后,AlphaGo的知识漏洞得以修复。在第四局78手同样的局面下,更新后的AlphaGo能够做出正确选择。时间飞逝,AlphaGo的进步,相比于一步一个脚印的人类,“是用飞的”(黄博士语)。11月7日,樊麾宣布AlphaGo将复出。

12月29日,一名为“Magister”(后改为“Master”)的账号悄然登陆弈城。最初愿与Master对弈的多为排名靠后的职业棋手,而连战连捷的Master迅速引得注视。一日十局,连战三日,柯洁、朴廷桓等人轮番挑战,未能撼动Master分毫。随后,Master转战野狐,各路豪强继续挑战,竟连一个胜机都找不到。最后一天,年届65岁的聂卫平出战。因聂老年事已高,对局用时特意延长了一倍。与古力的最后一局之后,Master达成60连胜。野狐的聊天框内弹出一条繁体中文消息“谢谢聂老师”,随后证实Master真身是AlphaGo的最新版本,由黄士杰博士控制。六天,六十局。AlphaGo在人间已无抗手。

与Master恶斗两局后,柯洁因身体不适住院。期间,柯洁不忘发微博赞叹对手的表现,也展示了自己的斗志。“若不是住院,我将用上那准备了一个星期的一招。” 未几,柯洁又晒出一张对战国产AI绝艺的棋谱,称用“非常手段”战胜了对手。只见棋盘上黑白棋子熙熙攘攘,围绕天元对称分布。棋近终局,执黑的绝艺贴不出目而认输。柯洁从头模仿到尾,而单纯的绝艺不知柯洁的险恶用心,稀里糊涂就输掉一盘棋。看来,柯洁的秘密武器就是模仿棋,而且对AlphaGo之外的AI颇有奇效。

2017年3月18日,柯洁登上央视当红访谈节目《朗读者》,直言“如果输会被嘲笑,但如果怕会输一辈子”。在朗诵环节,柯洁选择了《哈利波特与死亡圣器》的大结局。

......

一道红光划破了他们头顶上被施了魔法的天空,就好像耀眼的阳光掠过窗台从离他们最近的窗户里射进来,同时照亮了他们两人的脸,伏地魔的脸看起来就像燃烧了一般,与此同时,哈利用德拉科的魔杖指着空中,他听到两声最高分贝的、注入了全部的期望的叫声同时响起:

“阿瓦达索命!”

“除你武器!”

随着犹如大炮一般的巨响,金色的火焰从他们两人的魔杖中喷发出来,就在两人刚才踩过的生死圈的中心,咒语冲撞在了一起。哈利看到了伏地魔的绿色魔咒碰到了他自己的魔咒,看到了长老魔杖高高地飞起,在日出的映衬下,划过施了魔法的天花板,就像纳吉尼的头。它从那个梦寐以求想要拥有它的人的方位划过。而后哈利,做为一个出色的找球手,在伏地魔倒地的同时用他空着的一只手抓住了那根魔杖——而伏地魔双臂张开,猩红的眼睛里的瞳孔张开翻了起来。汤姆·里德尔死了,以最平凡的样子死掉了,他的身体绵软地收缩在一起,双手空空,蛇一般的脸惨白空洞。伏地魔死了,被他自己的咒语弹回去杀死了,哈利握着两根魔杖站在那里,低头看着地上那敌人的空壳。


董卿在《朗读者》节目获大奖的颁奖仪式上,不忘赞美柯洁“在他身上体现出来的敢于胜利的决心,面对挫败的勇气,这一点人永远比机器更加高贵”。

5月23日,中国乌镇围棋峰会,千呼万唤始出来。柯洁挑战AlphaGo Master,三番棋,每局保留用时增加到三小时。代替AlphaGo落子的还是黄士杰博士。首局,柯洁猜得黑棋先行。


双方各自占领空角之后,柯洁立即在右下点三三。点三三是常用侵消手段,但在棋局初期罕见。吴清源发起新布局革命之后,星位成为流行的占角手法。最初,职业棋手按照传统观念,以直接点三三应对,并逐渐演化出下图的标准定式。


棋手们很快发现,这个变化黑棋外势雄壮,白棋虽得角地却失于大局。于是,在之后的数十年中,布局初期点三三几乎绝迹。

谁也不曾想到,AlphaGo竟能颠覆这个最基本的定式。Master的网络六十局中,不仅常常甫开局就点三三,而且省略了标准定式中最后的扳粘(上图10-13手),改为在另一侧多爬一手,然后脱先。棋手最初不理解,还以为占到便宜。可等到后半盘,发现黑棋的“厚势”不知不觉变成了孤棋,被对手欺侮。其中关键就是AlphaGo省略的扳粘。不走扳粘,使得黑棋的外势不复往日厚实,而白棋角部并无死活之忧。

柯洁在此处点三三,是模仿对手,也是向对手致敬。右下角至22手,据范廷钰九段的解说,是国家队的最新研究成果。


白24豪放。此处,人类棋手通常会在A位干净地吃掉黑19一子,同时补上B处的弱点。AlphaGo选择飘逸地补棋,是判断外围虚走一手的价值比补断更大。这是人类棋手难以把握的判断。


柯洁期待先捞足实地,再入侵白棋大本营,以治孤决胜。人算不如狗算。左上角,AlphaGo略施小计便转进到了最实惠的角上,将四个兄弟抛给黑棋。仔细一算账,又是AlphaGo便宜了。这还不算完,白50更是令黑棋如鲠在喉,粘觉得不甘心,不粘又不安全。棋下到这里,白棋已完全掌握了主动权。

其实柯洁下得也不坏。黑棋随后深入虎穴,在下方白阵中活出一块。白棋一路领先,但差距始终没有拉开。奈何AlphaGo掌控局面的能力已炉火纯青。至114手,白棋在上边活出,扼死黑棋最后的翻盘希望。


官子阶段,AlphaGo就像往常一样,温柔地退让,令结果定格在白胜1/4子,中国规则下的最小差距。从过程来看,AlphaGo从第二个局部开始就不断获利,聚沙成塔,积累下足够的优势。柯洁发挥尚可,但AlphaGo下得太好。这是AlphaGo完胜的一局。

隔日,第二局,柯洁执白。AlphaGo喜欢白棋,柯洁也喜欢白棋,这都不是秘密。手执白棋,想必柯洁多了一分底气。

AlphaGo使用了和柯洁首局一样的小目·三三布局。AlphaGo不仅爱点三三,也会以三三占空角。三十年前曾流行的三三占角,因AlphaGo而复活。前八手,双方在左上和右下走出对称的棋形;但右上和左下一个星位、一个三三,意味着柯洁放弃了模仿棋,欲与对手正面对抗。


本局精彩的部分,比以往时候来得更早一些。黑11托,是AlphaGo偏爱的定型。在人类棋手的下法中,此定式通常用于白棋在A位附近有子,即黑棋挂角一子陷入夹击时采用。至黑19正常。白20点,柯洁挑起战端。由于该局部的配置与人类习惯的不同,白20点并无友军接应,直观看略显激进。


黑21反击,然后23断试应手、25跳。一套组合拳下来,白棋点入的二子已被封锁。柯洁小心翼翼的一冲,换来AlphaGo同样小心翼翼的一退。右上角的棋形十分微妙。白棋在A处断,即可快一气吃掉黑角上四子。但黑棋在C位简单一虎,让白棋只能收气吃,而黑棋外围不仅厚实,还有诸多借用和劫材。如此看来,A位断只是个美丽的陷阱。就在解说们替白棋想办法的时候,柯洁选择脱先,抢占下边大场。AlphaGo接下来也没有在右上走棋。谁先动手就能吃掉对手,却如食鸡肋,不如都不吃,也许将来这块鸡肋就变好吃了呢。

柯洁与AlphaGo在此局部的想法完全一致。局后的分析,从第11手开始到第30手为止,AlphaGo自己和柯洁的选择一模一样。其中,白20、26、30三手均为选择的难点,柯洁在此局部成功cosplay对手,实属不易。此局之后,该变化在职业对局中多次出现,有人称之为柯洁-AlphaGo定式。

之后,双方不紧不慢地占领左边和下边大场,直至55手。柯洁在第56手变招,碰黑棋的三三。


这步棋同时出乎人类棋手和AlphaGo的预料。正常白棋应走在A位,可以救回一子。AlphaGo对此给出的变化四平八稳,双方各自连接、定型。柯洁在复盘时说,他觉得自己在左边已经小亏了一点,继续平稳下去没有自信,不如拼一把。樊麾则透露,AlphaGo认为此时白棋胜率是51%,相比于空枰的55%(大贴目优势)略有下降,仍是平衡的局面。56这一手让白棋胜率直降八个百分点,棋局顿时失去控制。

尽管白棋胜率大降,棋局却进入了柯洁希望看到的乱战局面。AlphaGo战胜李世乭之后,各路AI群雄并起,其中佼佼者如绝艺、DeepZenGo达到甚至超过了顶尖职业的水平。棋手在与AI长期的对抗中发现,与AI拼内功,即较量细微处的选择、判断力,完全比不过。倒是在混战之中,AI偶尔犯一些低级错误,让人类抓住机会。AlphaGo输给李世乭的一局也是如此。全面升级之后的AlphaGo Master,会再给人类一个机会吗?


乱战局面,黑白双方如在钢丝上跳舞,稍有不慎就会落下万丈深渊。二十余回合的战斗后,至一百手,仍是不分胜负。白棋挑起了左下的劫争,让形势愈加混沌不清。在谷李五番棋第二局后,曾有“AlphaGo不会打劫”的谣言。谣言和现实的确相去甚远,AlphaGo打起劫来毫不含糊。不过,由于劫争反复循环,会占用AI的部分搜索深度,使得有劫争的局面对AI更困难。当前局面,黑白双方七块棋纠缠在一起,还有左下角一个巨大的劫争。如果AlphaGo会犯错,当下就是那个使她最有可能犯错的局面。

AlphaGo自评此局面黑棋胜率60%,小有优势,也可能反复。柯洁也嗅到了一丝胜机,小心脏扑通扑通地狂跳,以至于要用右手按在胸口平复心情。令人窒息的数分钟过去,柯洁落下114切断,留给镜头一个坚定的眼神。


此时,棋局的混乱达到了顶点。黑棋下面和右上两条大龙被切断,似乎难以两全。这可能是AlphaGo Master与人类对战中遇到过的最困难局面。接下来的几回合,是AlphaGo的表演时间。


黑119呆并,乍看是缓手。仔细揣摩后发现,黑A、B两点必得其一,要么可以吃掉下面白棋大块,要么可以和右上黑棋胜利会师,已立于不败之地。黑棋这一手,补全自身棋形的弱点,为接下来的发力创造了条件。这一着并,恰似拳击手缩回拳头蓄积力量,观察对手破绽再出拳,随即一击制胜。

柯洁不愿坐以待毙,放任右下大龙被围也要引爆左下的炸弹。可是,黑133落下之后,一切都结束了。柯洁少算了此处黑棋的一枚劫材,现在白棋没有机会打赢左下的劫争了。无奈之下,白棋选择救回左下数子,不足以挽回之前损失。坚持十余手后,柯洁投子。


认输之后,心情郁闷的柯洁喃喃自语。好在唐韦星、连笑、时越等好友马上围了过来,一起探讨棋局得失,冲淡了输棋的阴霾。

纵观全局,白棋并无明显胜机,但不失为一盘名局。棋坛曾有不止一位豪强号称“前五十手天下第一”,只有柯洁这盘棋是经过史上最强棋手AlphaGo认证的——五十手之后,人类的胜率仍领先,这是Master对局中的唯一。柯洁成功将局面导入预想的轨道,可惜全面升级后的AlphaGo,即使在极度复杂的局面下也不会犯错,能做出最好选择。正如哈萨比斯赛后所说,柯洁将AlphaGo逼到了极限,让AlphaGo不得不使出十成功力来应对。本局柯洁的表现,当得起“虽败犹荣”这四个字。

引文链接

“AlphaGo与人类的恩怨情仇” 全文系列:()()()()()()结束。

没有评论:

发表评论