機(jī)器學(xué)習(xí)介紹

關(guān)于機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)是一門數(shù)學(xué),事實(shí)上我在大二并沒有繼續(xù)深入學(xué)習(xí)這方面的打算阿纤,看的越多句灌,越意識(shí)到自己在數(shù)學(xué)方面的不足。
既然是介紹欠拾,那么首先胰锌,得說一下機(jī)器學(xué)習(xí)的好處。嗯藐窄,可以裝逼资昧。
你可以快樂的甩出一堆名詞—— 樸素貝葉斯算法,貝葉斯統(tǒng)計(jì)正則化荆忍,諸如此類格带。
現(xiàn)在很火的alpha??,也是機(jī)器學(xué)習(xí)的實(shí)用案例嘛刹枉。
但是叽唱,這也是一個(gè)大坑,這個(gè)東西的充分不必要條件有嘶卧,傅立葉變換尔觉,概率論(這個(gè)我不會(huì)),一些線性或非線性的運(yùn)算等等芥吟。
嗯侦铜,歡迎跳坑专甩。
那么我就用alpha??做例子好了,它通過線性訓(xùn)練局域特征钉稍,產(chǎn)生一個(gè)快速走棋的策略涤躲,通過深度訓(xùn)練,產(chǎn)生另一個(gè)策略贡未,然后自我對(duì)弈种樱,大規(guī)模訓(xùn)練。對(duì)弈時(shí)則使用訓(xùn)練好的網(wǎng)路判斷局部每一個(gè)點(diǎn)獲勝概率俊卤。
具體來說嫩挤,離線學(xué)習(xí)可以分為三個(gè)階段:

第一階段:利用3萬多幅專業(yè)棋手對(duì)局的棋譜來訓(xùn)練兩個(gè)網(wǎng)絡(luò)。一個(gè)是基于全局特征和深度卷積網(wǎng)絡(luò)(CNN)訓(xùn)練出來的策略網(wǎng)絡(luò)(Policy Network)消恍。其主要作用是給定當(dāng)前盤面狀態(tài)作為輸入岂昭,輸出下一步棋在棋盤其它空地上的落子概率。另一個(gè)是利用局部特征和線性模型訓(xùn)練出來的快速走棋策略(Rollout Policy)狠怨。策略網(wǎng)絡(luò)速度較慢约啊,但精度較高;快速走棋策略反之。

第二階段:利用第t輪的策略網(wǎng)絡(luò)與先前訓(xùn)練好的策略網(wǎng)絡(luò)互相對(duì)弈佣赖,利用增強(qiáng)式學(xué)習(xí)來修正第t輪的策略網(wǎng)絡(luò)的參數(shù)恰矩,最終得到增強(qiáng)的策略網(wǎng)絡(luò)。這部分被很多“磚”家極大的鼓吹憎蛤,但實(shí)際上應(yīng)該存在理論上的瓶頸(提升能力有限)外傅。這就好比2個(gè)6歲的小孩不斷對(duì)弈,其水平就會(huì)達(dá)到職業(yè)9段?

第三階段:先利用普通的策略網(wǎng)絡(luò)來生成棋局的前U-1步(U是一個(gè)屬于[1, 450]的隨機(jī)變量)蹂午,然后利用隨機(jī)采樣來決定第U步的位置(這是為了增加棋的多樣性栏豺,防止過擬合)彬碱。隨后豆胸,利用增強(qiáng)的策略網(wǎng)絡(luò)來完成后面的自我對(duì)弈過程,直至棋局結(jié)束分出勝負(fù)巷疼。此后晚胡,第U步的盤面作為特征輸入,勝負(fù)作為label嚼沿,學(xué)習(xí)一個(gè)價(jià)值網(wǎng)絡(luò)(Value Network)估盘,用于判斷結(jié)果的輸贏概率。價(jià)值網(wǎng)絡(luò)其實(shí)是AlphaGo的一大創(chuàng)新骡尽,圍棋最為困難的地方在于很難根據(jù)當(dāng)前的局勢(shì)來判斷最后的結(jié)果遣妥,這點(diǎn)職業(yè)棋手也很難掌握。通過大量的自我對(duì)弈攀细,AlphaGo產(chǎn)生了3000萬盤棋局箫踩,用來訓(xùn)練價(jià)值網(wǎng)絡(luò)爱态。但由于圍棋的搜索空間太大,3000萬盤棋局也不能幫AlphaGo完全攻克這個(gè)問題境钟。

目前機(jī)器學(xué)習(xí)主要的應(yīng)用領(lǐng)域有锦担,計(jì)算機(jī)視覺,數(shù)據(jù)挖掘等慨削。
至于這次的課程洞渔,除了知道什么是機(jī)器學(xué)習(xí),你是學(xué)不到什么的缚态,嗯磁椒,認(rèn)真要學(xué)的話,請(qǐng)上網(wǎng)易云課堂玫芦,斯坦福大學(xué)公開課衷快,已經(jīng)有漢化了。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末姨俩,一起剝皮案震驚了整個(gè)濱河市蘸拔,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌环葵,老刑警劉巖调窍,帶你破解...
    沈念sama閱讀 216,496評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異张遭,居然都是意外死亡邓萨,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門菊卷,熙熙樓的掌柜王于貴愁眉苦臉地迎上來缔恳,“玉大人,你說我怎么就攤上這事洁闰∏干酰” “怎么了?”我有些...
    開封第一講書人閱讀 162,632評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵扑眉,是天一觀的道長纸泄。 經(jīng)常有香客問我,道長腰素,這世上最難降的妖魔是什么聘裁? 我笑而不...
    開封第一講書人閱讀 58,180評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮弓千,結(jié)果婚禮上衡便,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好镣陕,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,198評(píng)論 6 388
  • 文/花漫 我一把揭開白布征唬。 她就那樣靜靜地躺著,像睡著了一般茁彭。 火紅的嫁衣襯著肌膚如雪总寒。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,165評(píng)論 1 299
  • 那天理肺,我揣著相機(jī)與錄音摄闸,去河邊找鬼。 笑死妹萨,一個(gè)胖子當(dāng)著我的面吹牛年枕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播乎完,決...
    沈念sama閱讀 40,052評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼熏兄,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了树姨?” 一聲冷哼從身側(cè)響起摩桶,我...
    開封第一講書人閱讀 38,910評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎帽揪,沒想到半個(gè)月后硝清,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,324評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡转晰,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,542評(píng)論 2 332
  • 正文 我和宋清朗相戀三年芦拿,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片查邢。...
    茶點(diǎn)故事閱讀 39,711評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡蔗崎,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出扰藕,到底是詐尸還是另有隱情缓苛,我是刑警寧澤,帶...
    沈念sama閱讀 35,424評(píng)論 5 343
  • 正文 年R本政府宣布实胸,位于F島的核電站他嫡,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏庐完。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,017評(píng)論 3 326
  • 文/蒙蒙 一徘熔、第九天 我趴在偏房一處隱蔽的房頂上張望门躯。 院中可真熱鬧,春花似錦酷师、人聲如沸讶凉。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,668評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽懂讯。三九已至荷憋,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間褐望,已是汗流浹背勒庄。 一陣腳步聲響...
    開封第一講書人閱讀 32,823評(píng)論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留瘫里,地道東北人实蔽。 一個(gè)月前我還...
    沈念sama閱讀 47,722評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像谨读,于是被迫代替她去往敵國和親局装。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,611評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容