系統(tǒng)之家 - 系統(tǒng)光盤下載網(wǎng)站!

當(dāng)前位置:系統(tǒng)之家 > IT快訊 > 詳細(xì)頁(yè)面

不按套路出牌,圍棋“狗咬狗”竟然是這樣的結(jié)果?

編輯:xiaochun 2017-05-31 09:44:16 來(lái)源于:IT之家

  在人機(jī)大戰(zhàn)2.0中,AlphaGo輕輕松松的將柯潔以3:0的成績(jī)KO了。而在戰(zhàn)勝世界第一的人類后,deepmind團(tuán)隊(duì)也宣布了AlphaGo也將退出棋壇,因?yàn)橐院蟮膽?zhàn)斗都沒什么意義了。而很多人則比較好奇,如果AlphaGo和自己對(duì)戰(zhàn)的話,那么結(jié)果又是怎樣的呢?而deepmind團(tuán)隊(duì)就在近日放出了20局AlphaGo的自戰(zhàn)棋譜,告訴大家,什么叫“狗咬狗”。

不按套路出牌,圍棋“狗咬狗”竟然是這樣的結(jié)果?

  “白狗”與“黑狗”的惡戰(zhàn)

  Alphago自從誕生以來(lái),主要通過自我對(duì)弈左右互搏不斷提升水平。和李世石對(duì)戰(zhàn)的版本已經(jīng)自我對(duì)弈了超過3000萬(wàn)盤,而和柯潔對(duì)戰(zhàn)的版本恐怕早已左右互搏了上億盤。此番公布的50盤AlphaGo自戰(zhàn)都是慢棋,1-2分鐘一步,應(yīng)該說實(shí)力上和與柯潔對(duì)戰(zhàn)的版本相同,所以很具有代表性。

  “狗咬狗”會(huì)發(fā)生什么?可以肯定的是,其結(jié)局不是以拔電源告終,而是同樣互有輸贏,輸棋的一方也并不是先死機(jī)的那個(gè),在很大程度上是決定于手里棋子的顏色。在AlphaGo的50局自戰(zhàn)中,執(zhí)白的一方——俗稱“白狗”贏了38盤,勝率接近80%,相當(dāng)驚人。在人機(jī)大戰(zhàn)第二局中,柯潔執(zhí)白曾經(jīng)把局勢(shì)導(dǎo)入到很混亂的局面,他自稱一度看到了機(jī)會(huì),在發(fā)布會(huì)上,他主動(dòng)申請(qǐng)第三局執(zhí)白,希望能夠復(fù)制第二盤的格局,因?yàn)閭髀凙lphaGo執(zhí)白棋的勝率會(huì)到55%。

  但其實(shí)這終究不是一個(gè)概率學(xué)問題,AlphaGo自戰(zhàn)中“白狗”勝率驚人也并非因?yàn)檫\(yùn)氣好,而是涉及到中國(guó)圍棋規(guī)則中的貼子(指先手一方補(bǔ)償給后手一方,確保黑白開局時(shí)局面均衡的保障),在人類高手看來(lái),黑貼3又3/4子對(duì)黑棋來(lái)說負(fù)擔(dān)有點(diǎn)重,導(dǎo)致黑棋的行棋趨向于激烈化。如今看來(lái),AlphaGo的自戰(zhàn)對(duì)局也證實(shí)了這一點(diǎn),而且表現(xiàn)出來(lái)的差距遠(yuǎn)比人類對(duì)局明顯,根據(jù)大量職業(yè)比賽的實(shí)戰(zhàn)結(jié)果統(tǒng)計(jì),中國(guó)規(guī)則下人類職業(yè)棋手黑棋的勝率大概在47%。在棋力已入化境的AlphaGo看來(lái)“黑狗”勝率太低,所以或許中國(guó)規(guī)則中關(guān)于貼子的規(guī)定該有所改變了。

不按套路出牌,圍棋“狗咬狗”竟然是這樣的結(jié)果?

  “狗咬狗”中人類被毀掉的“三觀”

  AlphaGo的50局自戰(zhàn)棋譜,對(duì)于職業(yè)棋手來(lái)說,可是珍貴的“武功秘籍”,如同當(dāng)年王重陽(yáng)走后留下的一部九陰真經(jīng)。但是這本秘籍卻讓人大跌眼鏡,“三觀”盡毀,因?yàn)槿绻凑誂lphaGo的套路,這么多年的圍棋可能真的是白學(xué)了,要不就是學(xué)了個(gè)假圍棋。

  首先是“套路觀” 。眾所周知,下圍棋是有是定式的,有套路的。AlphaGo的套路是什么?就是沒套路。在這50盤對(duì)局中,AlphaGo幾乎沒有擺完一個(gè)人類常見的定式,要么是開了個(gè)定式的頭,但走兩步就脫先(各走各路,你走一步我不理,我走一步你當(dāng)看不見)了,等什么時(shí)候想起來(lái)再看情況再出招,要么是直接忽略人類定式大全下出全新下法——可見人類圍棋史上總結(jié)的各類定式,絕大多數(shù)AlphaGo都是不認(rèn)同的,這也說明了定式其實(shí)是人類圍棋的“過擬合”——為了得到一致假設(shè)而使假設(shè)變得過度嚴(yán)格。

不按套路出牌,圍棋“狗咬狗”竟然是這樣的結(jié)果?

  其次是 “ 戰(zhàn)斗觀 ” 。 如果你懂棋,那么AlphaGo自戰(zhàn)棋譜恐怕會(huì)讓你不敢直視,如果你不懂棋,那么設(shè)想一下,“狗咬狗”的畫面是黃藥師大戰(zhàn)歐陽(yáng)鋒,而“狗咬人”則是黃藥師戲?骆(zhèn)惡。如果人類高手對(duì)局的對(duì)抗激勵(lì)程度是10,AlphaGo自我對(duì)弈的激烈程度起碼是100。全局性攻殺,大規(guī)模轉(zhuǎn)換,反復(fù)的劫爭(zhēng)在狗狗的自戰(zhàn)譜中比比皆是,這樣看和人類棋手對(duì)弈時(shí)求穩(wěn)的假象只是巨大優(yōu)勢(shì)下簡(jiǎn)明取勝的策略而已,就像老虎和獅子爭(zhēng)霸那一定是打得天翻地覆,老虎跟人打隨便撓兩下就結(jié)束戰(zhàn)斗了。所以像柯潔與AlphaGo第二盤那樣的全局混戰(zhàn)在人類眼中可能是非常復(fù)雜激烈,人類會(huì)有機(jī)會(huì),但在AlphaGo看來(lái)其實(shí)都是小把式。

不按套路出牌,圍棋“狗咬狗”竟然是這樣的結(jié)果?

  再有是“目標(biāo)觀”。 AlphaGo是實(shí)現(xiàn)“小目標(biāo)”的堅(jiān)定執(zhí)行者,盡管廝殺過程極其慘烈,但大部分情況下,激戰(zhàn)結(jié)束雙方各自收兵輕點(diǎn)棋盤上的累累尸骨劃定疆域,就會(huì)發(fā)現(xiàn)其實(shí)雙方的差距也就是半目或者一目半而已。50局自戰(zhàn)譜如果正常收完官子有約一半會(huì)以半目勝負(fù)收尾,可見AlphaGo掌控局勢(shì)的能力。而且在細(xì)微局面下AlphaGo的官子也不會(huì)出現(xiàn)和人類對(duì)弈時(shí)那種不斷退讓的情況。----比如本次人機(jī)大戰(zhàn)第一局,AlphaGo在開局領(lǐng)先后穩(wěn)穩(wěn)收兵最終只贏了1/4子,可以簡(jiǎn)單理解為AlphaGo并不在乎贏多少,只在乎贏沒贏,它會(huì)在任一局面下尋找當(dāng)前勝率最高的一點(diǎn),而且AlphaGo這種勝率就像GDP制約達(dá)康書記一樣牽著AlphaGo,它的每一個(gè)選點(diǎn)都是當(dāng)前局面勝率最高的一點(diǎn)(它自己認(rèn)為的),所以才會(huì)經(jīng)常出現(xiàn)在一個(gè)局部走了幾步突然就不走了,脫先到另外一個(gè)地方走幾步,然后又回來(lái)了之類的前后不連貫的情況。

不按套路出牌,圍棋“狗咬狗”竟然是這樣的結(jié)果?

  自相殘殺后留下“打狗秘籍”?

  既然拿到了“武功秘籍”,勤加修煉是必然,但能“以其人之道還治其人之身”嗎?說得深一點(diǎn),能實(shí)現(xiàn)人類圍棋的大躍進(jìn)嗎?

  人類圍棋的知識(shí)體系和AlphaGo完全不同,一個(gè)是由局部到全局的整合,一個(gè)是直接基于全局勝率選擇每一步棋的最佳選點(diǎn)。由于存在這樣根本性的差異,人類很難真正學(xué)會(huì)AlphaGo布局階段那些匪夷所思的脫先、打破定式的下法。再有,AlphaGo中后盤在激戰(zhàn)中的計(jì)算深度,遠(yuǎn)遠(yuǎn)超過人類大腦所能達(dá)到的限度——可以簡(jiǎn)單粗暴的理解為“狗”在復(fù)雜戰(zhàn)斗中能把未來(lái)100步棋的最優(yōu)解找出來(lái),而人類遠(yuǎn)遠(yuǎn)不能。

不按套路出牌,圍棋“狗咬狗”竟然是這樣的結(jié)果?

  但“秘籍”不是廢紙,人類圍棋發(fā)展的套路,就是每次都是出現(xiàn)一個(gè)天才,大幅度拓展大家的思路,讓圍棋發(fā)展到一個(gè)頂峰,然后出現(xiàn)了“過擬合”,大家的棋都局限在一個(gè)地方,直到下一個(gè)天才出現(xiàn)再次打破常規(guī)。以往這個(gè)角色是道策、秀策、吳清源,而如今,可能就是穿越千年而來(lái),提前告訴我們1000年后的圍棋該如何下的AlphaGo。

標(biāo)簽 AlphaGo

發(fā)表評(píng)論

0

沒有更多評(píng)論了

評(píng)論就這些咯,讓大家也知道你的獨(dú)特見解

立即評(píng)論

以上留言僅代表用戶個(gè)人觀點(diǎn),不代表系統(tǒng)之家立場(chǎng)

掃碼關(guān)注
掃碼關(guān)注

官方交流群 軟件收錄