2016.03.11
? ? ?最近在科技領(lǐng)域最火的就是谷歌DeepMind人工智能AlphaGo兩度戰(zhàn)勝了傳奇圍棋選手李世石吝羞。李世石是專業(yè)圍棋九段的高手瞻离,曾拿過十幾個(gè)世界軍躬拢,是圍棋界頂級(jí)的存在。而圍棋也被稱為最為復(fù)雜的智力游戲之一冕臭,因?yàn)樗挠螒蛞?guī)則簡(jiǎn)單余蟹,棋路特別復(fù)雜卷胯,這游戲能突顯出人的思維所在。AlphaGo是一臺(tái)計(jì)算機(jī)威酒,計(jì)算機(jī)擅長(zhǎng)的就是龐大的計(jì)算能力窑睁。曾經(jīng)IBM的深藍(lán)戰(zhàn)勝國(guó)際象棋冠軍就是靠它的強(qiáng)大的搜索運(yùn)算能力,然而alphago并不是主要使用了這個(gè)能力葵孤,圍棋路數(shù)復(fù)雜多變担钮,這個(gè)編程特別困難而且計(jì)算量特別大,超出了計(jì)算機(jī)的運(yùn)算能力尤仍。alphago之所以是人工智能的結(jié)晶,是因?yàn)樗幸惶谆谏疃葘W(xué)習(xí)的算法宰啦,就是一個(gè)類神經(jīng)網(wǎng)絡(luò),使機(jī)器具備識(shí)別赡模、記憶田炭、判斷等能力漓柑。
? ?alphago擁護(hù)什么樣的結(jié)構(gòu)了?人的神經(jīng)網(wǎng)絡(luò)系統(tǒng)特別復(fù)雜欺缘,那么這次alphago圍棋對(duì)戰(zhàn)是基于它的走棋網(wǎng)絡(luò)、快速走子谚殊、估值網(wǎng)絡(luò)、蒙特卡羅樹搜索嫩絮。1丛肢、走棋網(wǎng)絡(luò)(Policy Network)剿干,給定當(dāng)前局面,預(yù)測(cè)/采樣下一步的走棋置尔。2、快速走子(Fast rollout),目標(biāo)和1一樣幽歼,但在適當(dāng)犧牲走棋質(zhì)量的條件下,速度要比1快1000倍甸私。3诚些、估值網(wǎng)絡(luò)(Value Network),給定當(dāng)前局面皇型,估計(jì)是白勝還是黑勝诬烹。4、蒙特卡羅樹搜索(Monte Carlo Tree Search弃鸦,MCTS)绞吁,把以上這三個(gè)部分連起來,形成一個(gè)完整的系統(tǒng)寡键。
? ?alphago的學(xué)習(xí)能力到底有多強(qiáng)了掀泳,去年AlphaGo戰(zhàn)勝歐洲冠軍樊麾,那是的alphago和李世石根本就不是同一級(jí)別的西轩,按照人類的角度看员舵,一個(gè)那樣水平的對(duì)手至少要練上十年才能達(dá)到李世石的水平。在alphago與李世石對(duì)戰(zhàn)之前藕畔,也有人說alphago至少要一年時(shí)間才能追上马僻,李世石也認(rèn)為將是5:0完勝alphago。然而事實(shí)證明就是對(duì)alphago學(xué)習(xí)能力的完美證明注服。alphago在這六個(gè)月中收集樣點(diǎn)和自己對(duì)戰(zhàn)積累經(jīng)驗(yàn)韭邓,通過學(xué)習(xí)來提高它的圍棋水平。在李世石和alphago的對(duì)局中溶弟,根據(jù)他們的棋局中完全看不出是人機(jī)對(duì)戰(zhàn)女淑,alphago的下棋策略完全接近人的策略。
? ?alphago對(duì)戰(zhàn)李世石的意義非凡辜御,標(biāo)志著機(jī)器進(jìn)入了人工智能的世界鸭你。一旦人工智能實(shí)現(xiàn),對(duì)人類來說是機(jī)遇也是挑戰(zhàn)擒权。以前的機(jī)器只能做到精確性的工作袱巨,有了人工智能之后機(jī)器能做到模糊性的工作。通過人工智能后人的大部分工作都能由機(jī)器完成碳抄,盡管alphago擁有令人震驚的能力愉老,但是人類實(shí)現(xiàn)人工智能還有一段很長(zhǎng)的路要走。