寫暴走歐洲的系列文,寫了一半,實在忍不住回過頭來寫圍棋。今天這個題圖,我特意從棋魂動漫 的視頻中,找到這一幕截出來的。
第二盤棋,柯潔中盤認(rèn)負(fù),盤面上大龍橫死,如果僅從結(jié)局來看,似乎沒有第一盤,1/4子小負(fù)聽上去那么好。
但實際上,這盤棋的質(zhì)量和精彩,超出很多人的想象,而我今天要說的是,這是alphago與人類的所有對局里,棋譜最完美的一份。
alphago最早是15年底,alphago V13版本,在未公開的情況下,與退居二線旅居歐洲的職業(yè)棋手樊麾老師進行了測試性的對局,五盤不記錄成績的對局里,alphago三勝兩負(fù),(實際上樊老師贏了兩次alphago,不過是V13的版本,那個版本的實力尚不足以挑戰(zhàn)人類頂級高手),五盤記錄成績的對局里,alphago五勝零負(fù)。
這十盤棋譜,實際上質(zhì)量都不高,樊老師當(dāng)時壓力也很大,畢竟作為第一個輸給AI的職業(yè)棋手,情緒上出現(xiàn)波動是很難控制的。職業(yè)棋手當(dāng)時基于此棋譜做出判斷,認(rèn)為AI面對李世石不堪一擊,并非是盲目自信,但樊老師直到半年后,才有機會證明真的并非是自己的問題。
然而職業(yè)棋手完全低估了AI自我進化的能力,2016年的alphago V18版本,已經(jīng)擁有碾壓完爆V13版本的實力,據(jù)說是可以讓V13差不多3個子的水平。 與李世石的五盤棋的結(jié)果大家都知道了,四勝一負(fù),但這五盤棋譜,從質(zhì)量上來說,也難堪完美,重壓下的李世石多處技術(shù)變形,與其巔峰狀態(tài)相比其實還是有所差距;而alphago也存在多處被職業(yè)棋手詬病的處理方式,而第4局更是被李世石一個實質(zhì)上不成立的妙手打爆。
實際上,當(dāng)時AI即便存在應(yīng)對錯誤,局面仍然很難說就已經(jīng)勝負(fù)已分。但alphago當(dāng)時已經(jīng)出現(xiàn)了嚴(yán)重誤判,連續(xù)走出重大問題手,導(dǎo)致局面完全不可收拾,最后棋力不錯的黃博士代替AI強行認(rèn)輸,以免在棋譜上留下更加難堪的一幕。
所以,基于如上,柯潔才發(fā)出了,“能贏李世石,不能贏我”的豪言。而一些IT從業(yè)者當(dāng)時已經(jīng)神話AI,誤以為其棋力已經(jīng)邁入巔峰,無以倫比,并對職業(yè)棋手做出的判斷不屑一顧,其實這也是另一種的傲慢與偏見。
最后打臉這些IT從業(yè)者的,恰恰是alphago自己,2016年底alphago V25版本 化名master卷土重來,在網(wǎng)絡(luò)上橫掃人類頂尖棋手60盤。2017年與柯潔對戰(zhàn)的這個版本,功力又有提升,按照deepind公司他們自己最近官方公開的信息,這個版本和去年戰(zhàn)勝李世石的V18版本相比,可以讓前者3個子。
換句話說,去年那個版本,在今天的alphago眼里,千瘡百孔,不堪一擊,李世石所發(fā)現(xiàn)的問題和缺陷,絕不是僥幸和偶然的。而當(dāng)時直播中所有做即時點評的嘉賓職業(yè)棋手里,只有柯潔的形勢判斷是一直是最準(zhǔn)確的,有一定棋力的棋迷想必都還有印象。(我上篇文章 是的,柯潔輸了,然而又怎樣。 提到這個版本遠(yuǎn)勝于去年版本,但當(dāng)時官方還沒有提到3個子的領(lǐng)先優(yōu)勢,官方的聲明和數(shù)據(jù)印證了棋界之前的判斷,也凸顯了王思聰?shù)臒o理。)
那么,樊老師10盤,李世石5盤,master橫掃60盤,外加柯潔1/4子負(fù)的第一盤,截止到昨天為止,一共76盤公開的棋譜,我告訴你們,其實每一個棋譜里, AI都下的不夠完美,當(dāng)然,這些不完美,有少部分是它依舊不夠完善,有很多是它認(rèn)為這樣下足夠贏了。
除了保持優(yōu)勢“穩(wěn)如狗”的退讓策略,已經(jīng)被廣泛理解之外。職業(yè)棋手對AI棋譜最大的詬病是AI會輕易的濫用先手,將變化走盡。從人類學(xué)圍棋的經(jīng)驗來說,保留變化(專業(yè)術(shù)語是保留味道)是非常重要的,在后續(xù)的對弈中,根據(jù)不同的進程會有不同的選擇,而且特別是針對打劫的時候,根據(jù)劫爭的大小,先手是可以有選擇的用來作為劫財使用。
但AI專家說,走盡變化是算法剪枝,減少搜索樹的分支,減少后續(xù)的計算量。 在過去的70多盤人機對弈里,AI頻頻出現(xiàn)這樣的場景,但很遺憾的是,由于其局面掌控能力過于強大,人類完全無法對這樣的行為作出有效的反制。
那么問題來了,第一,保留變化是否是人類對圍棋一廂情愿的理解?第二,AI是否會在劫爭緊張的時候出現(xiàn)這樣的問題?
所幸這一盤,柯潔的表現(xiàn),迫使AI作出了答案。
這一盤柯潔的意圖非常明顯,(其實上一盤也很明顯,先撈后洗,簡單說就是先拿住能確定的空,再去破壞對手的成空潛力。) 打亂棋形,通過亂戰(zhàn)尋求機會。而這一戰(zhàn),柯潔成功的將棋局帶入了自己的意圖。(上一戰(zhàn),AI在實地和外勢平衡方面,展現(xiàn)了強大的局面控制力,成功的破壞了柯潔的意圖,早早形勢就進入了AI的掌控)
經(jīng)常看到柯潔在一塊棋尚未安定的時候,又強硬的開出一塊新戰(zhàn)場,形成雙方各有幾塊棋不活的彼此絞殺局面(最多時雙方各有五塊孤棋,這屬于極為罕見的亂戰(zhàn)形勢),可以說很早就進入了懸崖邊的戰(zhàn)斗,任何一方,只要一著不慎,就會萬劫不復(fù)。
盡管在二十多手的時候,AI就連續(xù)走出了讓職業(yè)棋手贊嘆不絕的定型妙手,但柯潔的頑強讓AI一直沒有借此真正建立優(yōu)勢,直到一百手棋的時候,雙方依然糾纏不清,局勢難判,根據(jù)deepmind老板在twitter的表達(dá),在此時,AI并沒有認(rèn)為自己占有優(yōu)勢,這是這個版本之前所有對局中,都沒有出現(xiàn)過的。柯潔逼出了AI的極限。(以上是基于alphago的自我形勢判斷數(shù)據(jù),而非棋界人士的經(jīng)驗,更不是無憑無據(jù)的恭維)。
柯潔其實在七十多手棋的時候,已經(jīng)在左下角設(shè)計了一個巨大的劫爭,卻引而不發(fā),繼續(xù)將局面搞亂,又在右下角試圖再度挑起一個劫爭,然而此時,alphago并沒有讓柯潔如愿,我不負(fù)責(zé)的猜測一下,一些其他的圍棋AI程序,在連環(huán)劫上判斷經(jīng)常出嚴(yán)重問題,所以柯潔大約是希望將棋引入這樣的局面,甚至有可能考慮過去設(shè)計一個三劫循環(huán),但很顯然,alphago不會讓人類如此輕而易舉的達(dá)成目標(biāo)。
但關(guān)鍵的事情出現(xiàn)了,從柯潔引導(dǎo)alphago進入他所設(shè)計的劫爭,并引而不發(fā)之后,幾十手棋的進程里,我們注意到一個事實,alphago一直在保留變化,一直選擇引而不發(fā),沒有剪枝,沒有濫用任何先手權(quán)力,沒有做任何浪費劫財?shù)氖虑椤?/p>
這證明了兩件事情,第一,保留變化是有價值的,人類對此的經(jīng)驗積累沒有問題。只是絕大部分情況下,alphago認(rèn)為無需保留變化也足夠贏棋。 第二,alphago完全理解劫財?shù)膬r值和保留,但打劫會導(dǎo)致勝率的不可控,所以在非必要的情況下,它會主動規(guī)避打劫。
只有柯潔的實力展現(xiàn),才讓人有機會看到alphago被逼交出的答案。
然而很可惜,在膠著的局勢下,alphago第119手使出了一步妙手,這步棋如果沒有職業(yè)棋手講解,我根本看不出來好在哪里。這步棋走出來后,柯潔兩片孤棋已經(jīng)難兩全。
但盡管局勢轉(zhuǎn)向不利,劫爭尚在,勝負(fù)仍然存在懸念。 可惜的是,千算萬算,劫財居然不如對手。是的,正如上面文章所提,在柯潔引入復(fù)雜劫爭的局面后,alphago本盤罕見的沒有浪費一個劫財,并一直有意或無意的保持著對柯潔的劫財優(yōu)勢。
在劫爭引爆后,136手被一些職業(yè)棋手批評為敗招,因為劫財明顯偏小,alphago斷然消劫后勝負(fù)已分,然而,我更愿意理解為,這是在劫財不足的情況下,柯潔對ai實施的一項騙招,此時AI尚有若干劫財沒有使用,柯潔保留了更大的劫財,而試圖用這個較小的劫財引導(dǎo)AI形成誤判應(yīng)劫,一旦AI應(yīng)劫,柯潔將憑空多出一個劫財,成功將局勢引導(dǎo)到自己掌控的一邊,但顯然這個策略并未生效。 alphago的邏輯簡單清晰,基于劫財?shù)膬r值不足,顯然消劫后勝率過高。
部分職業(yè)棋手認(rèn)為,當(dāng)時應(yīng)該繼續(xù)擴大局面的復(fù)雜性,對AI的整片棋進行更大范圍的攻擊和纏繞,讓棋盤整體陷入更大的死活計算中,我作為業(yè)余棋手,沒有能力發(fā)表這方面的判斷,但從實戰(zhàn)而言,deepmind官方的表態(tài)已經(jīng)證明了柯潔的狀態(tài)和能力,很多關(guān)鍵地方的處理與AI自己的最優(yōu)選擇完全一致,而直到中盤AI自己的數(shù)據(jù)判斷,依然是形勢混沌膠著不分。最后確實棋差一招,但也已經(jīng)足夠體現(xiàn)了人類的尊嚴(yán)。
alphago消劫后,寥寥數(shù)手柯潔即示意認(rèn)輸,其實雖然一條龍橫死看上去比較悲壯,但左上alphago也付出了巨大的代價,雙方的差距也并不是特別巨大,如果對手是人類,棋盤上依然有可戰(zhàn)的空間。
不過,此時亂戰(zhàn)已經(jīng)結(jié)束,而 alphago將毫無疑問的進入“穩(wěn)如狗”的境界,繼續(xù)下去,是的,我們可以預(yù)料alphago不斷退讓,柯潔不斷占一點官子便宜,差距越來越小,但很抱歉,對手不會給你任何翻盤的機會。與其這樣獲得一個大殺小敗的外行看上去相對體面的結(jié)果,不如就這樣結(jié)束,保留一張沒有缺陷的棋譜給后人。
這就是我說的,在過去的76張alphago與人類的對局譜里,這是alphago最完美的一張棋譜,沒有退讓,沒有剪枝,沒有無棋自補,每一手棋都極具效率,恰到好處,因為只有遇到這樣的對手,alphago才會有這樣的答卷。
是的,去年李世石讓alphago交出了一份不及格的答卷,李世石的棋力和天才自然不容置疑,但別忘了,今年這個版本,棋力讓去年的三個子。
機器學(xué)習(xí)在快速的成長,但我們很多人似乎沒意識到,機器學(xué)習(xí)的成就,也帶動著人類的學(xué)習(xí)和進步,如果alphago把系統(tǒng)的決策數(shù)據(jù)完全開放出來,人類在棋道探索上的進步還會前進一大截,這件事情也是圍棋界一直在極力要求并渴望的事情。然而很遺憾,到目前為止,這一塊還只能停留在很有限的范圍內(nèi)進行交流。
責(zé)任編輯:海凡
- 阿爾法狗再進化:AlphaGo Zero自學(xué)3天100:0擊敗老狗,附詳細(xì)解讀2017-10-19
- 最強阿爾法狗誕生:AlphaGo Zero橫空出世,阿爾法狗退役2017-10-19
- 世界圍棋冠軍柯潔戰(zhàn)新銳賽奪冠 柯潔:想后輩記住我的厲害2017-10-19
- 檢驗酒店“寵物友好”政策 加拿大女子帶馬入住2017-10-18
- 點燃創(chuàng)新火苗 陳建仁:全力打造臺灣為創(chuàng)新島2017-09-29
- 吳昕節(jié)目中自曝 私下沒有和潘瑋柏單獨吃飯也沒有聚會2017-09-15
- 世界圍棋第一人柯潔吐槽《最強大腦》套路深,節(jié)目有什么黑幕嗎?2017-08-25
- 世界圍棋最新排名柯潔仍居榜首 前十中國占一半2017-08-22
- 推諉責(zé)任!蔡英文的停電道歉毫無誠意2017-08-21
- 快棋賽柯潔爆冷出局 對手:他嚴(yán)重失誤致局勢一落千丈2017-08-15
- 最新科技數(shù)碼 頻道推薦
-
被國產(chǎn)手機打趴!三星手機在國內(nèi)市場份額狂降2017-11-14
- 進入圖片頻道最新圖文
- 進入視頻頻道最新視頻
- 一周熱點新聞
已有0人發(fā)表了評論