close

陳經:再次對決AlphaGo,柯潔的勝算有多大

醞釀瞭近一年的二次人機大戰終於有瞭正式消息。4月10日,谷歌與中國棋院宣佈,2017年5月23日起,AlphaGo將與柯潔進行三番棋對決。勝者獎金150萬美元,負者出場費也高達30萬美元,是圍棋比賽有史以來的最高獎金。

一、勝一盤的重要性

然而,150萬美元獎金雖高卻像畫餅,幾乎沒人相信柯潔能勝兩盤獲得比賽的勝利。但這不是錢的事,隻要柯潔勝一盤,就能封神瞭。

這次比賽會下滿三盤,古力說柯潔隻有10%的機會勝一盤,還可能樂觀瞭。一些資深棋迷打賭開的賠率也是柯潔勝一盤賠10倍。這相當於說,柯潔和AlphaGo下,30盤才能勝一盤。

棋界現在一種說法是,AI戰勝人類帶來圍棋技術的大發展,人類學習AI與AI共同進步。這算是呼應谷歌團隊的姿態,說棋藝有大發展、學習AI,這都沒問題。但圍棋首先是個勝負的遊戲,對職業棋手來說,勝負壓倒一切。圍棋和國際象棋、中國象棋不一樣,和棋極少,輸半目也是輸,更殘酷。現在不能認慫,還是應該爭取戰勝AlphaGo,隻勝一盤意義都大於這150萬美元的獎金。我相信,如果柯潔能勝AlphaGo一盤,倒貼錢他都願意。柯潔自己也是鬥志滿滿,在央視《朗讀者》上讀哈裡波特,把AlphaGo比作伏地魔,聲稱要“零封AlphaGo”。

烘焙設備

柯潔參加《朗讀者》,閱讀《哈利波特》

去年李世石以1:4慘負AlphaGo,震動瞭棋界甚至整個世界,引發瞭人工智能熱潮。《自然》與《科學》都將這個事件列為年度八大、十大科技進展。對外界來說,1:4和0:5似乎區別不大,對棋界就不一樣瞭。如果沒有這一勝,棋手們面對AlphaGo將極度自卑,隻剩下各種恐懼與膜拜。去年人機戰第三盤AlphaGo序盤碾壓李世石,以3:0勝出比賽的時候,棋界氣氛極度壓抑,幾乎沒人再對李世石抱有希望。直到第四盤李世石勝出,棋手們才恍然大悟,原來AlphaGo的命門是計算!整個棋界大緩瞭一口氣。李世石說,這一勝拿什麼也不換,意義真有這麼大。

去年正因為我深深知道人類勝局的重大意義,才在幾乎所有人都絕望的時候,仍然堅持分析AlphaGo的弱點,還真預測到瞭李世石勝出的方式。

Master年初60:0碾壓人類高手,現在棋界的氣氛又和去年3:0時差不多瞭。某種程度甚至更為絕望,因為這回盤數很多有說服力。而且能戰勝人類的AI不隻AlphaGo瞭,還有絕藝和DeepZenGo。好消息是有職業實力的AI隻有這三個,壞消息是連最弱的DeepZenGo都不好對付。

3月18至19日的計算機圍棋UEC杯,絕藝在預賽和決賽中兩勝DeepZenGo,AI界的老二老三座次排定。緊接著3月21至23日的首屆世界圍棋最強戰中,老三DeepZenGo代表AI與中日韓三大高手下瞭三局每方三小時的慢棋,一局完勝兩局憾負,前半盤都是明顯領先。3月26日UEC杯的後續節目電聖戰,絕藝與DeepZenGo都表現上佳擊潰日本新銳一力遼。在野狐圍棋網,絕藝實力不斷進步,在快棋中對人類高手勝率高達9成,並以碾壓態勢率先升為10段。柯潔對絕藝13連敗,已經1個月沒有公開和絕藝下瞭。如果人類連絕藝和DeepZenGo都打不過,那還怎麼和AlphaGo較量?

二、正確認識AlphaGo,消除恐懼

人類棋手的誤區是,總是不由自主把圍棋AI當作人來看待自動分料機推薦,首先根據戰績判斷AI的實力,其次看棋譜。以前看棋譜覺得AlphaGo實力不強,李世石100萬美元獎金天上掉餡餅。AlphaGo3:0勝出的時候,又覺得AlphaGo不可戰勝瞭,要讓二子。李世石勝瞭一盤,又覺得原來AI有弱點,畏懼心理消除。AlphaGo升級為Master下得又快又好創新很多,又覺得它深不可測,不可戰勝瞭。看DeepZenGo網上戰績,高手們評價不太高,但從最強戰三局慢棋實戰表現來看是低估瞭它。隻有絕藝一直和高手們親密接觸,甚至有能悔棋的內測版,開發人員中也有羅洗河這個世界冠軍,所以棋手們瞭解多些。

圍棋AI是程序,思維和人截然不同,不能象觀察人那樣去想象它的能力。它強的地方,不要低估,它弱的地方,也不要高估。除瞭戰績、棋譜這些擺在明面上的信息,更值得分析的是AI的算法。應該從算法原理去分析,圍棋AI為什麼強,為什麼弱,結合實戰表現,做出合理的解釋與猜想。現在棋界一大問題是對AlphaGo太過懼怕,不少職業棋手對Master可以說是嚇死的,招法完全變形,序盤就敗瞭。不瞭解對手,對手下的招出乎預料就害怕傻眼瞭,時間壓力之下失去正常思維,這根本沒法下棋瞭。

棋界迫切需要盡量瞭解AlphaGo,對它的行為模式建立預期,消除恐懼。Master的60局棋譜,棋手們研究一段時間瞭,有瞭相當的認識。由於谷歌的保密風格,算法上AlphaGo有什麼重大進展信息極少,但也還是有一些可以分析的,本文會從算法角度進行推測。

我的結論是,AlphaGo是個“圍地大師”、“創新大師”,但並不是“戰鬥大師”,棋藝從原理上就存在短板,但是特長極強,掩蓋瞭弱點。柯潔僅僅是消除畏懼心理,恢復平常心是不夠的,這還是傳統思維模式,也不一定做得到。人類高手不能空喊“有信心”之類的口號,需要從理性上確立“獲勝是可以做到的”這個信念,根據AlphaGo的算法特點,改變傳統思維模式,針鋒相對與它戰鬥,爭取在人機戰中獲得勝利突破。柯潔在人類棋手中思維活躍、攪功無敵,是戰勝AlphaGo的最好人選。希望柯潔采用正確戰術,取得一勝。隻要一勝,二次人機大戰就會成為棋手與棋迷的狂歡節。



特別有幫助的是,騰訊開發的絕藝達到瞭極高水平,柯潔和絕藝極為開放的內測版下,可以反復實踐演練自己的想法,並不是悶頭準備。騰訊開發圍棋AI的團隊就有三個,絕藝隻是勝出的那個,這個投入確實很有魄力,如果柯潔能打破AlphaGo的堅冰,棋界要感謝騰訊。

由於絕藝不斷在野狐圍棋網上下,雖然勝率不斷提高,但還是經常輸給職業高手,所以人們可能低估瞭它的實力。絕藝輸主要是出bug,表現正常的時候實力極為可怕,而且在快速進步,要看最近的勝率。業餘六段和職業棋手也就是讓先到二子的差距,據說有業六讓四子和絕藝下20分鐘的慢棋還是輸瞭。絕藝的棋風和AlphaGo不同,創新不多,但是力量太大瞭,出手很敏銳。4月10日開始絕藝在野狐復出下棋每天兩盤,是20分鐘和三次1分鐘讀秒的慢棋。到4月14日,對10位職業高手取得瞭9勝1負的戰績。

通過和絕藝的不斷對局,人類高手已經相信,自己正常1分鐘讀秒的表現會比20、30秒好得多,對絕藝勝率明顯提高(指以前版本,絕藝最新版本又進步瞭)。AI對手和人不是一回事,人類下快棋對AI實力會大降。如果現在的絕藝和人類高手下20秒、30秒的快棋,再加上人類高手不瞭解它,如果它還新手不斷,殺個60:0不是不可想象。有瞭絕藝這個參照物,年初Master的表現也就不是這麼震憾瞭。絕藝雖然在快速進步,但人類高手由於看著它成長的,和它下思維比較正常,表現要好得多。

我這並不是心靈雞湯式的給人類圍棋高手打氣。如果是國際象棋,從算法原理上就知道,人類不可能戰勝AI。國際象棋AI和人下棋的思路差不多,算得比人深遠,無論是局勢評估還是推理搜索,人會的AI全會,還更厲害。國際象棋AI能下出人類無法想象的“AI”棋,人類確實沒理由戰勝AI。但圍棋是另一種遊戲,不僅復雜得多,特點還完全不同。AI和人是用兩種截然不同的思維模式下圍棋,AI學會瞭人的部分本事,還發展出瞭新的本事,在局勢評估上遠遠強於人。但是人也有AI不會的絕招,就是復雜戰鬥、對殺、死活、精確收官等以推理為基礎的圍棋技術,由於AI沒有概念推理的能力,這些任務對AI算法來說很困難。

相當於人和汽車的賽跑比賽,如果是一條平路,汽車必然戰勝人。如果路上有的地方有墻,有的地方有溝,人會翻墻也會下到溝裡再上來,而汽車翻墻過溝不太會,可能會翻車輸給人。人如果選擇在平路和汽車比拼,那當然必輸;如果把比賽引向翻墻過溝的比拼,不僅比賽有趣多瞭,還真可以獲勝。比賽之前人制定戰術的時候,不能說要平常心,要學習汽車的高速度爭取跑出博爾特的水平,那也是輸。為瞭勝利就應該揚長避短,跑步也要會,不要跑步就把腿折瞭退賽。速度落後於汽車不要驚慌,如果能把汽車引向有墻有溝的路段,就能等到時機。

當然AlphaGo的能力很強,很難把它引向表現差的路段,這隻是一個比喻。但可以肯定AlphaGo不是全能的,從算法原理上就有漏洞。最高水平的國際象棋AI互相比賽絕大多數是平局。兩個AlphaGo自我對局總是能分出勝負,也不是每局都差距很小。這中間肯定有大量的局面,在算法的能力之外,AlphaGo執黑或執白隨機地出錯。

食品填充機

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 dfv779vr77 的頭像
    dfv779vr77

    玉玉的購買清單

    dfv779vr77 發表在 痞客邦 留言(0) 人氣()