[原] 三連陽(yáng)小勝過(guò)擬合碳胳,一爆倉(cāng)回到解放前:R法狗的大菊觀和蒙特卡洛樹(shù)

Introducing Monte Carlo Methods with R
Introducing Monte Carlo Methods with R

前言

最近幾天,R法狗和李世石的人機(jī)大戰(zhàn)非常熱鬧浅蚪,周圍的朋友基本都是看好R法狗能五殺的節(jié)奏烫罩,不過(guò)我一直持有懷疑的態(tài)度贝攒。理由也很簡(jiǎn)單,對(duì)于這么好的博弈機(jī)會(huì)隘弊,國(guó)內(nèi)外必然存在一些勢(shì)力對(duì)這一事件做變相莊家(陰謀論)梨熙,如果其中有一兩局存在變數(shù),賠率非逞噬龋可觀质欲,這里有我在知乎上的回答

R法狗與股票交易

參考 知乎的問(wèn)答:AlphaGo 的學(xué)習(xí)決策模型是否能用于股票市場(chǎng)的交易怎憋?

下面是 徐所謂向前 的高分答案

其一九昧,圍棋是一個(gè)封閉系統(tǒng)赠橙,是一個(gè)完全信息系統(tǒng)愤炸,無(wú)論是現(xiàn)在的深度學(xué)習(xí)還是以前的機(jī)器學(xué)習(xí),都依賴于龐大的樣本訓(xùn)練凤薛,訓(xùn)練完成之后的樣本外輸入诞仓,其本質(zhì)和可能性要與訓(xùn)練樣本相同墅拭。例如圍棋只能你一步我一步在固定區(qū)域內(nèi)下,所有的規(guī)則都是實(shí)現(xiàn)就已經(jīng)約定好的舒憾。而金融市場(chǎng)并不是完全信息系統(tǒng)穗熬,這一點(diǎn)在很多人的回答中也都提到。也就是很多新的情況探遵,是系統(tǒng)不可預(yù)估的妓柜,并不是在歷史中存在的,在這種情況下藏雏,之前的訓(xùn)練會(huì)失效塌衰。做過(guò)自動(dòng)程序化交易的人都知道蝠嘉,如果自己不清楚策略為什么賺錢(qián)蚤告,不清楚背后的理論是什么努酸,是不敢放任其自動(dòng)交易的。就算深度學(xué)習(xí)系統(tǒng)經(jīng)過(guò)了長(zhǎng)期驗(yàn)證获诈,也不能保證某些黑天鵝來(lái)臨的時(shí)候,它能正確的應(yīng)付舔涎,這個(gè)幾乎是無(wú)法證明的亡嫌。或許賺了幾年但是幾分鐘就全虧回去了于购。比如今天第四場(chǎng)小李子終于贏了一局肋僧。在下棋中出現(xiàn)bug輸一局無(wú)所謂嫌吠,在交易中出低級(jí)bug可能就再也無(wú)力翻身了居兆。

其二泥栖,阿法狗的paper中提到吧享,人類現(xiàn)有的棋譜在訓(xùn)練中只占到了很小的一部分。他們發(fā)現(xiàn)如果只用人類現(xiàn)有的棋譜殊鞭,阿法狗很快會(huì)陷入過(guò)度優(yōu)化操灿。因此對(duì)于阿法狗的訓(xùn)練趾盐,自己和自己下棋才是訓(xùn)練集的大部分救鲤。這也是為什么在盤(pán)中總是出現(xiàn)一些人類無(wú)法理解的下發(fā)本缠,認(rèn)為是阿法狗的失誤丹锹。其實(shí)阿法狗算得很清楚卷仑,因?yàn)槿祟愒谟趪宓母鞣N可能性走法其實(shí)還只探索了一部分粘昨。對(duì)應(yīng)到金融市場(chǎng)张肾,所有的行情吞瞪、新聞芍秆、財(cái)報(bào)等等妖啥,對(duì)于這樣一個(gè)復(fù)雜系統(tǒng)來(lái)說(shuō)荆虱,數(shù)據(jù)量遠(yuǎn)遠(yuǎn)不夠怀读。但是系統(tǒng)不可能像圍棋那樣自己模擬出行情菜枷、新聞和財(cái)報(bào)等信息椿息。因?yàn)閲宓淖叻ㄓ幸?guī)矩,而行情并不是隨機(jī)生成的數(shù)據(jù)序列枫耳。因此想要完全使用深度學(xué)習(xí)預(yù)測(cè)明天大盤(pán)的漲跌是不可能的孟抗,因?yàn)闆](méi)有足夠的訓(xùn)練樣本凄硼。

從這里我們可以得到結(jié)論:R法狗的學(xué)習(xí)模型可以部分輔助交易,但很難全部適用于股票交易狐史。

雖然R法狗并不是完美的说墨,但是從這次人機(jī)大戰(zhàn)中我們能看到蒙特卡洛樹(shù)算法(MCTS)的局勢(shì)判斷能力(大菊觀)大放異彩。確實(shí)姜贡,基于模擬計(jì)算技術(shù)已經(jīng)成為現(xiàn)代統(tǒng)計(jì)學(xué)家工具箱中的一個(gè)重要組成部分楼咳,仿真模擬和可視化技術(shù)可以在直覺(jué)上輔助決策者做出決策烛恤。

DeepMind的創(chuàng)始人Hassabis說(shuō)AlphaGo做的是,引進(jìn)了神經(jīng)網(wǎng)絡(luò)這種直覺(jué)層面的東西糙申,而直覺(jué)是頂級(jí)圍棋棋手間的差距船惨。

上述引用自 Google谷歌愛(ài)好者的微博 粱锐,可以看出,現(xiàn)在直覺(jué)在人工智能決策中的重要作用铐然。管中窺豹,明星交易員在股票交易中的重要性也是不可小覷的沥阳。

什么是蒙特卡洛樹(shù)

蒙特卡洛樹(shù)(Monte Carlo Tree Search)從字面上看就是 蒙特卡洛(仿真模擬) + 樹(shù)(決策樹(shù))自点,它是一種人工智能中的優(yōu)化算法桂敛,結(jié)合了隨機(jī)模擬的一般性和樹(shù)搜索的準(zhǔn)確性,MCTS 在博弈論中正在廣泛應(yīng)用薪伏。

算法

蒙特卡洛樹(shù)將決策問(wèn)題描述為一種二叉樹(shù)的決策樹(shù)形式嫁怀,將問(wèn)題求解分為四個(gè)步驟潦牛。

  1. 選子

  2. 設(shè)想下一步棋走到哪個(gè)位置

  3. 自行模擬雙方下棋若干步

  4. 返回一個(gè)最優(yōu)解

迭代方法

每次選子都考慮兩件事:

  1. 選子后的若干步是否占優(yōu)
  2. 這種選子方案在這些模擬中被用了多少次巴碗。(正常人記不住,只能主觀判斷)

約束

選子的主要困難在于如何平衡這兩個(gè)問(wèn)題:

  1. 在高平均勝率下模擬幾步合適召噩?
  2. 如何少量模擬完成自我博弈過(guò)程逸爵?

顯然模擬過(guò)多會(huì)占用過(guò)多的計(jì)算資源师倔,模擬過(guò)少得不到好的結(jié)果。

目標(biāo)函數(shù)

為了解決這個(gè)問(wèn)題疲恢,所以有以下公式:
$$\frac{w_i}{n_i} + c\sqrt{\frac{\ln t}{n_i}}$$

  • $w_i$ 表示第$i$步的勝率
  • $n_i$ 表示第$i$步的模擬次數(shù)
  • $c$ 人工參數(shù)瓷胧,靠科學(xué)家選擇的一個(gè)數(shù)字
  • $t$ 總模擬次數(shù)

這個(gè)公式中可以看出來(lái)搓萧,想要總勝率得分高宛畦,就需要適當(dāng)控制模擬次數(shù)揍移,但模擬過(guò)多會(huì)受到懲罰羊精,而模擬過(guò)少則存在隨機(jī)偏差過(guò)大的問(wèn)題囚玫。

更多算法相關(guān)討論可以參考 Not_GOD大神簡(jiǎn)書(shū)文章:蒙特卡洛樹(shù)搜索 MCTS抓督。

實(shí)現(xiàn)

參考資料

作為分享主義者(sharism)阳液,本人所有互聯(lián)網(wǎng)發(fā)布的圖文均遵從CC版權(quán)帘皿,轉(zhuǎn)載請(qǐng)保留作者信息并注明作者 Harry Zhu 的 FinanceR專欄:https://segmentfault.com/blog/harryprince畸陡,如果涉及源代碼請(qǐng)注明GitHub地址:https://github.com/harryprince。微信號(hào): harryzhustudio
商業(yè)使用請(qǐng)聯(lián)系作者丁恭。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末曹动,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子牲览,更是在濱河造成了極大的恐慌墓陈,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,039評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件第献,死亡現(xiàn)場(chǎng)離奇詭異贡必,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)痊硕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)赊级,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)岔绸,“玉大人理逊,你說(shuō)我怎么就攤上這事橡伞。” “怎么了晋被?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,417評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵兑徘,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我羡洛,道長(zhǎng)挂脑,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,868評(píng)論 1 295
  • 正文 為了忘掉前任欲侮,我火速辦了婚禮崭闲,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘威蕉。我一直安慰自己刁俭,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,892評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布韧涨。 她就那樣靜靜地躺著牍戚,像睡著了一般。 火紅的嫁衣襯著肌膚如雪虑粥。 梳的紋絲不亂的頭發(fā)上如孝,一...
    開(kāi)封第一講書(shū)人閱讀 51,692評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音娩贷,去河邊找鬼第晰。 笑死,一個(gè)胖子當(dāng)著我的面吹牛育勺,可吹牛的內(nèi)容都是我干的但荤。 我是一名探鬼主播,決...
    沈念sama閱讀 40,416評(píng)論 3 419
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼涧至,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼腹躁!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起南蓬,我...
    開(kāi)封第一講書(shū)人閱讀 39,326評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤纺非,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后赘方,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體烧颖,經(jīng)...
    沈念sama閱讀 45,782評(píng)論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,957評(píng)論 3 337
  • 正文 我和宋清朗相戀三年窄陡,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了炕淮。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,102評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡跳夭,死狀恐怖涂圆,靈堂內(nèi)的尸體忽然破棺而出们镜,到底是詐尸還是另有隱情,我是刑警寧澤润歉,帶...
    沈念sama閱讀 35,790評(píng)論 5 346
  • 正文 年R本政府宣布模狭,位于F島的核電站,受9級(jí)特大地震影響踩衩,放射性物質(zhì)發(fā)生泄漏嚼鹉。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,442評(píng)論 3 331
  • 文/蒙蒙 一驱富、第九天 我趴在偏房一處隱蔽的房頂上張望锚赤。 院中可真熱鬧,春花似錦萌朱、人聲如沸宴树。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,996評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至又憨,卻和暖如春翠霍,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蠢莺。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,113評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工寒匙, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人躏将。 一個(gè)月前我還...
    沈念sama閱讀 48,332評(píng)論 3 373
  • 正文 我出身青樓锄弱,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親祸憋。 傳聞我的和親對(duì)象是個(gè)殘疾皇子会宪,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,044評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容