?
最近很火的AlphaGo擊潰了人類的最強(qiáng)精英,很多媒體借此延伸出這是人工智能飛躍的標(biāo)志性事件吱肌,更有甚者,直接冠以人工智能全面替代人類已指日可待的大標(biāo)題仰禽。
輸贏無(wú)定式氮墨,但是可算。
AlphaGo對(duì)輸贏的概念吐葵,是算法設(shè)計(jì)者已經(jīng)根據(jù)固有圍棋規(guī)則用代碼設(shè)定好的规揪。這是有前提條件的人機(jī)競(jìng)賽,輸贏的概念已經(jīng)定下來(lái)了温峭,對(duì)弈的雙方都是奔著已經(jīng)定好的規(guī)則去走的猛铅,并且是可計(jì)算的。但顯然現(xiàn)實(shí)人類社會(huì)里的輸贏是和棋類競(jìng)技定義是不同的凤藏,而且往往更加的復(fù)雜奸忽。
棋路可計(jì)算是AlphaGo能夠贏的前提條件。
即使是精于計(jì)算的AlphaGo清笨,也無(wú)法保證在落棋的時(shí)候能寸土不失月杉!因從對(duì)弈當(dāng)中來(lái)看,AlphaGo也是和人一樣存在出現(xiàn)失誤和失子的情況抠艾。
出現(xiàn)這樣的情況的原因苛萎,一是算法還不是最優(yōu)版本;二是AlphaGo還處于在學(xué)習(xí)的階段检号。
它之所以會(huì)被視為人工智能里程碑式的突破的一般邏輯是腌歉,圍棋不像其它棋弈,現(xiàn)在有技術(shù)條件不可能有足夠的內(nèi)存和運(yùn)算處理器來(lái)通過(guò)記憶龐大的數(shù)據(jù)和強(qiáng)硬的窮舉方式來(lái)演算出最后的勝局齐苛,換句話說(shuō)翘盖,谷歌的技術(shù)大拿們讓AlpahGo擁有了像人類的直覺(jué)一樣的評(píng)估系統(tǒng)來(lái)對(duì)棋局的勢(shì)和每一步落棋進(jìn)行評(píng)估,以判斷出勝算較大的棋路凹蜂。
剛開(kāi)局的時(shí)候馍驯,面對(duì)一個(gè)空空如也的棋盤(pán)阁危,AlphaGo和李世石是一樣的,對(duì)棋局未來(lái)的走勢(shì)的判斷都是模糊的汰瘫,只是它比人類好一點(diǎn)的地方在于狂打,它可以比人類計(jì)算出多一些棋路,但這些棋路未必是最優(yōu)的混弥,所以為了減少計(jì)算量趴乡,它必須得學(xué)得和人類一樣,以最快的速度(類似人類的直覺(jué))屏棄掉低價(jià)值的或者說(shuō)低勝率的棋路蝗拿,判斷出高勝率棋路的集合晾捏,并從中挑選可能是最優(yōu)的棋路“校可以說(shuō)惦辛,在棋局開(kāi)始的時(shí)候,AlpahGo并不比李世石要強(qiáng),甚于可能會(huì)偏弱萤捆。
但隨著棋局的深入展開(kāi)裙品,雙方在棋盤(pán)上落下的棋子越來(lái)越多俗批,可落子的目則越來(lái)越少俗或,可行的棋路也在不斷減少。這時(shí)候岁忘,機(jī)器的在記憶能力和計(jì)算能力方面的優(yōu)勢(shì)就凸顯出來(lái)了辛慰。
在棋路減少到一定的數(shù)量級(jí)時(shí),AlphaGo甚至只需要依靠機(jī)器硬件最基礎(chǔ)的功能——記憶干像、搜索能力帅腌,用強(qiáng)硬的窮舉法,便可以很輕松的計(jì)算出勝率最高的棋路了麻汰。而經(jīng)過(guò)一番苦戰(zhàn)的李世石的精力與腦力很顯然無(wú)法和AlphaGo相比速客,他再不輸棋,那也太說(shuō)不過(guò)去了五鲫。
從某種意義上來(lái)講溺职,只要AlphaGo對(duì)初期棋局的外勢(shì)不出現(xiàn)什么重大的錯(cuò)估,那中后期基本就是穩(wěn)贏位喂。而且浪耘,這個(gè)所謂的中后期會(huì)因?yàn)橛布阅艿某掷m(xù)提升和更新而不斷提前。
目前世界圍棋界第一人塑崖,中國(guó)的90后柯潔就是看到AlphaGo對(duì)勢(shì)的判斷并不高明七冲,才會(huì)說(shuō)AlphaGo無(wú)法戰(zhàn)勝他。實(shí)際對(duì)弈棋勢(shì)如何规婆,只有等他和它真正的坐在對(duì)弈的座位上較量了后才知道了澜躺。但是蝉稳,留給我們?nèi)祟愖顝?qiáng)的圍棋高手的時(shí)間真的不多了。
AlphaGo體現(xiàn)了人類對(duì)已有知識(shí)整合的智慧掘鄙,提供了人工智能的一個(gè)好的參考模式颠区。
從Google在《自然》上發(fā)布的AlphaGo算法來(lái)看(鳥(niǎo)叔不是AI磚家,僅是只計(jì)算機(jī)菜鳥(niǎo)通铲,只能粗略的看看毕莱,就是打醬油路過(guò)看看的那種看看),它的核心算法蒙特卡羅樹(shù)搜索(Monte Carlo Tree Search颅夺,MCTS)起源于上個(gè)世紀(jì)40年代美國(guó)的“曼哈頓計(jì)劃”朋截,經(jīng)過(guò)半個(gè)多世紀(jì)的發(fā)展,它已在多個(gè)領(lǐng)域廣泛使用吧黄,例如解決數(shù)學(xué)問(wèn)題部服,產(chǎn)品品質(zhì)控制,市場(chǎng)評(píng)估拗慨。應(yīng)該說(shuō)廓八,這個(gè)算法只算是沿用,并沒(méi)有發(fā)展出突破性的算法赵抢。它的算法結(jié)構(gòu):落子網(wǎng)絡(luò)(Policy Network)剧蹂,快速落子系統(tǒng)(Fast rollout)、估值系統(tǒng)(Value Network)烦却、蒙特卡羅樹(shù)搜索(Monte Carlo Tree Search宠叼,MCTS)把前三個(gè)系統(tǒng)整合起來(lái),構(gòu)成AlphaGo的整體系統(tǒng)其爵。
另外冒冬,如果沒(méi)有幾千年來(lái)圍棋前人在對(duì)弈棋局上的積累,AlphaGo就沒(méi)有足夠的對(duì)弈樣本摩渺,它就無(wú)法去演算每一步棋的發(fā)展態(tài)勢(shì)简烤,也就無(wú)法形成有效的勝率樣本,也就是說(shuō)它的學(xué)習(xí)神經(jīng)無(wú)法形成對(duì)初期勢(shì)的判斷和落子價(jià)值的評(píng)估了(算法第一作者中的AjaHuang本身就是一個(gè)職業(yè)圍棋手摇幻,在AlphaGo之前横侦,他已將許多棋譜喂到他之前開(kāi)始的圍棋系統(tǒng)中)。
AlphaGo不具有通用性囚企,或者說(shuō)它是弱通用性丈咐,它只代表了人工智能的一方面,離真正的人工智能還有很長(zhǎng)的路要走龙宏。在這里要向那些寫(xiě)出這個(gè)算法和AlphaGo程序的許多科技大拿致敬棵逊,他們實(shí)實(shí)在在的邁出了人工智能重要的一步。
如果說(shuō)人工智能是一盤(pán)圍棋银酗,那么AlphaGo顯然只是這盤(pán)棋局剛開(kāi)始的一小步而已辆影,在它之后是一整片未知的宇宙等待著我們?nèi)ヌ剿鳌?/p>
而人工智能究竟是會(huì)成為讓牛頓發(fā)現(xiàn)萬(wàn)有引力的落蘋(píng)果還是變成毒死計(jì)算機(jī)之父圖靈的毒蘋(píng)果……這我怎么知道徒像,我只是路過(guò)看看。
但是蛙讥,如果有一天锯蛀,有一顆蘋(píng)果落在人工智能的腦袋上,它能像牛頓一樣發(fā)現(xiàn)到萬(wàn)有引力次慢,那我愿意承認(rèn)那是真正的智慧旁涤。