11/19讀書筆記(2)

1忆绰、蒙特卡洛搜索算法和基于深度學(xué)習(xí)的模式識別促成了AlphaGo的成就蒸走。

據(jù)各方研究來看惊楼,AG不是自己想出棋著來狰右,而是學(xué)習(xí)了人類高手的千萬盤棋局(這就是大數(shù)據(jù))杰捂。它記錄下每個棋局中的每個局面,把上百萬個局面當(dāng)作輸入進行訓(xùn)練棋蚌,通過一個多層神經(jīng)網(wǎng)絡(luò)來預(yù)測人類高手會走出的下一著嫁佳。經(jīng)過巧妙的神經(jīng)網(wǎng)絡(luò)設(shè)計與訓(xùn)練,這個多層神經(jīng)網(wǎng)建模了人類高手的“棋感”——對于當(dāng)前局面谷暮,已知以往下棋歷史中的勝率蒿往。在實際下棋時,計算機可以通過視覺識別記錄下棋局坷备,然后和以往的棋局?jǐn)?shù)據(jù)比較熄浓,找到相同的模式(局面),再檢索不同局面往后發(fā)展下去省撑,根據(jù)以往下棋史中的勝率高低選出一些高質(zhì)量的候選點供走子赌蔑,而不必每個候選點都去嘗試一遍,從而極大地減少系統(tǒng)運算量竟秫,不至于讓系統(tǒng)“殫精竭慮”而死娃惯。這就像人類,不會窮盡所有候選點肥败,而是根據(jù)經(jīng)驗和感覺選擇某些點趾浅。選出幾個點之后,人類還是要比較馒稍、計算哪個點更好皿哨。對于機器來說,這個計算就交給蒙特卡洛搜索算法纽谒。

蒙特卡洛樹形搜索是對以往決策樹算法的優(yōu)化证膨。對于以往的決策樹算法,即便給了一個高質(zhì)量的候選點鼓黔,對于接下來的選擇央勒,它同樣要進行窮舉,在每個要選擇的地方做一次分支澳化,同樣會遇到可選路徑數(shù)量的指數(shù)爆炸崔步。

蒙特卡洛方法就體現(xiàn)了概率學(xué)的精妙。假設(shè)在某個棋局局面下缎谷,深度學(xué)習(xí)網(wǎng)絡(luò)給出了三個候選落子辦法A井濒、B、C列林,以這三個點為根節(jié)點眼虱,分別往下走子,可以想象成三個樹席纽,每棵樹還有無數(shù)分支捏悬。蒙特卡洛搜索不去窮盡所有分支,而是派出300萬只螞蟻分別從A润梯、B过牙、C出發(fā),每個點100萬只纺铭,飛速向樹梢爬(也就是往下黑白棋交替走子直到?jīng)Q出勝負(fù)寇钉,基本上走200步就會分出勝負(fù)),總有部分螞蟻走到最高點(也就是決出勝負(fù)舶赔,假設(shè)螞蟻走到終點的情況代表黑子勝扫倡,沒走到終點的情況代表白子勝)。

假設(shè)從A點出發(fā)的100萬只螞蟻有30萬只到達(dá)終點,B的為50萬只撵溃,C為40萬只疚鲤,系統(tǒng)就認(rèn)為黑子走B點勝率更高扣草,就會選擇B點奇颠。這就是概率學(xué)的取樣算法,相比逐項窮舉法温圆,極大地縮減了計算量语淘。

CPU芯片和GPU(圖形處理器)芯片同時進行神經(jīng)網(wǎng)絡(luò)計算與蒙特卡洛樹形搜索诲宇,模擬海量的終盤局面,這是人類計算能力無法相比的惶翻。由于采用深度學(xué)習(xí)建模了人類高手的棋感姑蓝,看上去人工智能擁有了人類的大局觀,而這個大局觀恰恰蘊含在人類高手的千萬盤對弈數(shù)據(jù)里吕粗。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末纺荧,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子溯泣,更是在濱河造成了極大的恐慌虐秋,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,406評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件垃沦,死亡現(xiàn)場離奇詭異客给,居然都是意外死亡,警方通過查閱死者的電腦和手機肢簿,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,732評論 3 393
  • 文/潘曉璐 我一進店門靶剑,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人池充,你說我怎么就攤上這事桩引。” “怎么了收夸?”我有些...
    開封第一講書人閱讀 163,711評論 0 353
  • 文/不壞的土叔 我叫張陵坑匠,是天一觀的道長。 經(jīng)常有香客問我卧惜,道長厘灼,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,380評論 1 293
  • 正文 為了忘掉前任咽瓷,我火速辦了婚禮设凹,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘茅姜。我一直安慰自己闪朱,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,432評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著奋姿,像睡著了一般锄开。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上胀蛮,一...
    開封第一講書人閱讀 51,301評論 1 301
  • 那天院刁,我揣著相機與錄音糯钙,去河邊找鬼粪狼。 笑死,一個胖子當(dāng)著我的面吹牛任岸,可吹牛的內(nèi)容都是我干的再榄。 我是一名探鬼主播,決...
    沈念sama閱讀 40,145評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼享潜,長吁一口氣:“原來是場噩夢啊……” “哼困鸥!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起剑按,我...
    開封第一講書人閱讀 39,008評論 0 276
  • 序言:老撾萬榮一對情侶失蹤疾就,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后艺蝴,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體猬腰,經(jīng)...
    沈念sama閱讀 45,443評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,649評論 3 334
  • 正文 我和宋清朗相戀三年猜敢,在試婚紗的時候發(fā)現(xiàn)自己被綠了姑荷。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,795評論 1 347
  • 序言:一個原本活蹦亂跳的男人離奇死亡缩擂,死狀恐怖鼠冕,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情胯盯,我是刑警寧澤懈费,帶...
    沈念sama閱讀 35,501評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站博脑,受9級特大地震影響憎乙,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜趋厉,卻給世界環(huán)境...
    茶點故事閱讀 41,119評論 3 328
  • 文/蒙蒙 一寨闹、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧君账,春花似錦繁堡、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,731評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽闻牡。三九已至,卻和暖如春绳矩,著一層夾襖步出監(jiān)牢的瞬間罩润,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,865評論 1 269
  • 我被黑心中介騙來泰國打工翼馆, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留割以,地道東北人。 一個月前我還...
    沈念sama閱讀 47,899評論 2 370
  • 正文 我出身青樓应媚,卻偏偏與公主長得像严沥,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子中姜,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,724評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 開場白 AlphaGo兩番贏下了人類圍棋世界的真正高手消玄,世界第二的韓國棋手李世石[1]。 賽前丢胚,準(zhǔn)確說是Googl...
    LostAbaddon閱讀 1,584評論 2 19
  • He deals the cards as a meditation 他出牌前沉思冥想And those he p...
    隱劍鬼吊閱讀 1,634評論 2 2
  • 本文系《文工團》約稿携龟,禁止一切形式的未授權(quán)轉(zhuǎn)載兔跌,謝謝合作。這篇是約稿的第二版骨宠,第一版可以點這里浮定。 圍棋,是一項中國...
    LostAbaddon閱讀 2,581評論 7 10
  • 這篇文章以比較通俗的語言簡單介紹了AlphaGo的工作原理层亿,可以先看看了解大概桦卒,會發(fā)現(xiàn)AlphaGo也沒有那么神秘...
    Founting閱讀 13,151評論 0 7
  • Daddy told me about cool MD5 hash collision today.I wanna...
    Umiade閱讀 244評論 0 1