2018年8月15日星期三

人类与AlphaGo的恩怨情仇(六):煮酒论史

2017年5月26日,上午,配对赛。古力+AlphaGo执黑对战连笑+AlphaGo。所谓配对赛,就是双人联棋。和乒乓球双打规则类似,行棋顺序是古力→连笑→AlphaGo1(古力队友)→AlphaGo2(连笑队友)→古力,以此循环。正规的联棋比赛中,队友之间不可以交流。当然,这回古力和连笑也无法和他们的人工智能搭档交流。

开局不久,AlphaGo又秀了一把她对定式的独特理解。


白12跳,罕见。普通的着法是在左一路爬。轮到古力九段,以大力著称的他当然要惩罚白棋的“无理手”。


到黑21征死白一子为止,黑棋把白棋完全限制在角上,按照以前的定论是黑棋不错。白棋的唯一收获是可以在右上角引征。AlphaGo非常看重此处引征的价值,认为如果在A位碰,会使黑棋的胜率下降到44%,反而是白棋稍优。实战连笑温柔地在B位引征,AlphaGo认为逸机,双方基本回到同一起跑线。AlphaGo以其远超人类的模糊判断能力重新诠释了围棋的布局,白12跳是又一个鲜活的范例。

在右下的战斗中,黑棋巧妙弃子,获得优势。至后半盘,连笑一度认为白棋已经落后很多,欲拼死一搏。但连笑发现AlphaGo着法不乱,仍然稳健地行棋,可见局势并不十分悲观,心情稍定。于是连笑决定和队友一起耐心等待机会。围棋又名“手谈”,意指对弈双方不用语言交流,仅看棋盘上的内容就知道他人心中所想。尽管AlphaGo非我族类,当我们熟悉了她的脾性,总能通过棋盘聊聊天。


机会来得不算太晚。白棋通过弃子安定中央之后,在左边黑阵中暴动,做出打劫活,一举逆转。连笑的耐心、与队友的默契得到了回报。执黑的AlphaGo胜率在数回合后跌穿阈值,示意认输。古力按照赛前与连笑的约定,任性地拒绝认输。AlphaGo不开心,索性进入“疯狗”模式,在白空中连连送死,终于令古力举牌认输。连笑为人类赢得了对抗AlphaGo Master的“首胜”。

同日下午,五位年轻的世界冠军陈耀烨、周睿羊、芈昱廷、时越、唐韦星联手对战AlphaGo。相谈棋的形式是队友之间讨论以后落子。职业围棋赛中,珠钢杯(金龙城杯)的半决赛和决赛采取此赛制。此前的相谈棋多为中韩顶级棋手间的对抗。由于时间充足,讨论可以避免低级失误,相谈棋的质量颇高。此次比赛之前,棋界曾对相谈棋寄予厚望,认为相谈棋能大幅缩小人类与AlphaGo的差距。事与愿违,最后定下的赛制,人类团队仅有两个半小时的保留时间,甚至少于柯洁一人战的三小时。时间紧张,不能充分讨论,甚至可能还不如不讨论。雪上加霜的是,周睿羊让黄博士猜到了白棋,本局不可避免地变成一出情景喜剧。 


实战,黑棋起手双飞燕,即用两手棋夹击对手星位。清代国手范西屏云,“起手双飞,不无太紧”。而最近几年职业棋手普遍认为双飞燕总能占到便宜,应避免被对手双飞燕。AlphaGo Master在这个问题上赞同古人,认为黑棋的双飞燕并不好。不过,相比于接下来黑棋的处理,双飞燕显得是个小问题。五人团在左边的腾挪手法上纠结许久,意见不一。而瞻前顾后的结果不能更糟:黑棋封锁左下白棋失败,左边的孤棋成为单方被告。左下多花一手棋,什么都没走到,还额外赠送左边实地给白棋。AlphaGo认为此时白方胜率达到74%。

棋局早早失衡,黑棋苦苦支撑。好不容易找到杀棋的机会,AlphaGo却滑如泥鳅,轻松突围。大转换之后,黑棋已失去希望。棋局最后,黑棋还落后几目。有人提议,不如左下角点进去,看看AlphaGo会不会退让,只赢半目。


黑253点入后,这个局部即使对业余爱好者也不算难题。白棋只需在A位档,即可把黑棋照单全收。不料,AlphaGo竟走了五人团“期待”的254退让,给黑棋留下B位的便宜。如果白棋是人类,254这样的棋不知该解读成仁慈还是羞辱。而对手是AlphaGo,254就只剩喜感了。照相机记录下了五位棋士的反应,著名的“欢声笑语,打出gg”。


5月27日,柯洁与AlphaGo,最后一局。第二局后的新闻发布会上,柯洁请求第三局执白,得到同意。


AlphaGo采用变形中国流(黑7比普通中国流左一路)布局。此布局在AlphaGo自战对局中罕见。AlphaGo在棋局的前三十手会在几个备选项中随机选择一个,而不是直接选择胜率最高(注:严格地说,AlphaGo的决策标准不是胜率最高,而是模拟中重复最多的一个分支。所以在AlphaGo Teach中有时会看到,其它备选项比AlphaGo的选择胜率更高的情况)的一手棋。一方面,引入随机因素可以避免AlphaGo陷入局部最优,被对手摸清棋路。另一方面,布局阶段的很多情况下,两个不同选项的差别确实很小,选哪个都差不多。

实战柯洁挂入中国流内侧之后,AlphaGo的黑13又是新手。柯洁摸不清AlphaGo的意图,谨慎选择了脱先。右边打入之后,白20是柯洁苦心的一手。白棋左右逢源,黑棋很难捉住白棋。不料,AlphaGo回敬柯洁一个脱先,转而攻击白右下角。


处理完右下角,柯洁抢到先手。然而白28、30失误。白棋想掏空黑棋的右上角,但多花一手棋之后反而背上了包袱。白棋右边和上边三块棋被完全割开,各自均未安定。右上角多补一手又太缓,柯洁给自己制造了一道难题。


白32碰,好手!星位碰小目也是AlphaGo的首创。在黑棋小目加拆边的棋形下,星位碰小目意外地有力。柯洁再次向对手致敬,时机恰到好处。至38,白棋打穿黑棋上边,形成转换,柯洁重新打开了局面。

惜乎好景不长。黑39立问应手,白40飞操之过急。柯洁期待黑棋简单补断,这样白棋右边一块孤棋容易处理。谁知黑41直接点三三,将白棋原本固若金汤的右下角掏空。棋局对柯洁愈加困难。


之后,白棋踉踉跄跄地跑出右边一块,但牺牲了下边七个兄弟。至上图的第99手,黑棋优势不可动摇。

镜头拍到柯洁不在座位的画面。事后我们才知道,柯洁是在幕后擦眼泪。难受、委屈,笔者观看本局直播时就是这样的感受。从第20手开始,AlphaGo就完美地掌控着棋局。柯洁的反击除了第32手以外,统统像打在棉花上一样无力。人类与AlphaGo的最后一盘棋,全球棋迷都看着。棋下成这样,柯洁心中的不甘可想而知。

拭去眼泪,棋局还要继续。柯洁在左边强行作战,无奈黑棋太厚,白棋收获有限。之后的官子,AlphaGo一如既往地安全运转。眼看又是一局半目负,柯洁不愿再受对手施舍,愤而玉碎。白棋送死右边大龙,以此为台阶认输。


赛后,哈萨比斯宣布AlphaGo退役。中国棋院为AlphaGo颁发九段证书。

柯洁在人机大战之后一度无人能挡,取得22连胜,并拿下全运会金牌。此后柯洁状态起起伏伏,既有大赛三度被淘汰的痛苦,也有拿下利民杯、新奥杯的喜悦。在与人类的对弈中,柯洁化身“点三三狂魔”,尝试将AlphaGo的知识化为己用。另一方面,柯洁食“不再与人工智能对弈”之言,在网络平台与各路AI废寝忘食地黑砍,败多胜少,屡败屡战。新版本绝艺复出后与人类战近百局,仅输给柯洁一局。

三年多以前,大卫·席尔瓦在和黄士杰博士讨论将价值网络加入AlphaGo。他们不知道AlphaGo能走到哪一步,只是想尝试一种新思路。今天,AlphaGo取得了他们当年不敢想象的成绩。过去的两年,AlphaGo与人类的恩怨情仇,对所有围棋人是一生只有一次的经历。李世乭弈出流芳千古的一挖;柯洁知其不可而为之,逼出强敌的极限。现在,AlphaGo正在深刻地改变围棋。从棋盘上的技术细节,到棋盘外的舆论喧嚣,围棋正处于千年未有之变局。站在历史的十字路口,无人可知五十年后的围棋会是何种模样。

滚滚长江东逝水,浪花淘尽英雄。是非成败转头空,青山依旧在,几度夕阳红。 白发渔樵江渚上,惯看秋月春风。一壶浊酒喜相逢,古今多少事, 都付笑谈中。

引文链接

“AlphaGo与人类的恩怨情仇” 全文系列:()()()()()()结束。

没有评论:

发表评论