[量化學院]監(jiān)督式機器學習算法的應用:擇時

導語:《Machine Learning for Stock Price Forecasting》是Ali El-Shayeb撰寫的機器學習系列文章 永票,本文主要介紹其第二部分內容——《監(jiān)督式機器學習算法的應用》谭胚,并將其思想和代碼應用在中國股票市場菇爪,開發(fā)出具有擇時功能的監(jiān)督式機器學習算法央渣,最后進行策略回測。對此感興趣的小伙伴可以直接在本文文末克隆策略源代碼,進行深入和擴展研究。

《監(jiān)督式機器學習算法的應用》

Ali El-Shayeb通過價格和成交量相關的9個特征訓練模型围橡,特征列表和數(shù)據(jù)來源見下圖。

image

作者希望訓練出一個二分類模預測模型缕贡,來預測市場屬于牛市還是熊市狀態(tài)翁授。在訓練集數(shù)據(jù)處理上,如果交易日t+30價格小于t交易日價格晾咪,那么標注為0收擦,否則標注為1。通過特征數(shù)據(jù)和標注數(shù)據(jù)可以訓練出一個二分類模型谍倦,接著在預測集上進行預測塞赂,如果預測結果為1,表明為買入信號昼蛀,如果預測集為0宴猾,表明是賣出信號。最后叼旋,通過預測結果回測檢驗策略收益曲線仇哆。

需要補充的一點是,作者將訓練集上80%的數(shù)據(jù)作為訓練集夫植,20%的數(shù)據(jù)作為驗證集讹剔,在驗證集上評估策略的預測效果。評估指標為準確率详民,準確率計算公式為預測正確的天數(shù)與總預測天數(shù)的比值延欠。

模型比較

Ali El-Shayeb嘗試了多個機器學習分類模型,發(fā)現(xiàn)模型表現(xiàn)各不一樣(見下圖)沈跨。通過構建更多的特征能夠消除數(shù)據(jù)噪音由捎,獲取更好的預測結果。此外饿凛,作者還發(fā)現(xiàn)預測時間越長狞玛,模型預測越準確邻奠。模型的準確率較之于隨機猜測(50%漲,50%跌)的差值为居,恰恰能夠體現(xiàn)模型的有效性。

image

交易策略

華爾街專業(yè)量化交易員預測第二天漲跌的準確率為55%杀狡,預測未來30天股價的準確率高達80%蒙畴。Ali El-Shayeb發(fā)現(xiàn),使用支持向量機分類算法的準確性最高呜象,模型會告訴他膳凝,如果價格下跌就賣出股票,如果價格上漲就買入股票恭陡。該策略從08年到10年每月收益為1.3%蹬音,期間策略總收益為31.2%。在該時間段休玩,基于標準普爾S&P500買入并持有的策略收益率為-6.9%著淆。

展望和不足

  • 股票價格受很多因子影響,股票池不一樣拴疤,總能找到比較好的策略回測曲線
  • 模型偏簡單永部,沒有考慮宏觀方面的一些特征,比如GDP呐矾、通貨膨脹率苔埋、利率水平等
  • 財報的因子也沒有考慮進去,未來可以基于自然語言處理(NLP)的算法對財報進行分析預測

A股市場策略復現(xiàn)

本文將Ali El-Shayeb的量化思想應用在A股上面蜒犯,因為本質上該策略屬于擇時策略组橄,因此我們只需確定股票。這里我們以深高速(600548.SHA)為例罚随,如果大家想要換成其他股票玉工,修改下證券代碼列表這個模塊的參數(shù)即可。

本文完全采用Ali El-Shayeb提到的9個因子毫炉,其中2015年到2017年初為訓練集瓮栗,2017年到2018年為預測集(回測區(qū)間)。因為是二分類算法瞄勾,所以我們采取Logistic Regression算法费奸,如果大家想檢驗一下其他二分類算法的效果,可以直接在模塊里將算法更改為sklearn機器學習包相關的算法名稱进陡。

策略回測結果:

image

從上圖可以看出愿阐,該策略在在回測區(qū)間總收益率為17.36%,而如果直接買入并持有該股票的話,策略總收益率為9.3%骂删。該策略主要是通過擇時空倉規(guī)避了下跌,可見該策略擇時有效祭刚。

需要說明的是辛孵,本文旨在復現(xiàn)國外數(shù)據(jù)科學家的一個量化策略丛肮,介紹如何在A股市場開發(fā)ai量化策略,希望大家能夠快速高效開發(fā)策略魄缚。因此并不對策略收益做保證宝与。

參考文獻

附錄

BigQuant——人工智能量化投資平臺

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市冶匹,隨后出現(xiàn)的幾起案子习劫,更是在濱河造成了極大的恐慌,老刑警劉巖嚼隘,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件诽里,死亡現(xiàn)場離奇詭異,居然都是意外死亡飞蛹,警方通過查閱死者的電腦和手機谤狡,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來卧檐,“玉大人豌汇,你說我怎么就攤上這事⌒垢簦” “怎么了拒贱?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長佛嬉。 經常有香客問我逻澳,道長,這世上最難降的妖魔是什么暖呕? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任斜做,我火速辦了婚禮,結果婚禮上湾揽,老公的妹妹穿的比我還像新娘瓤逼。我一直安慰自己,他們只是感情好库物,可當我...
    茶點故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布霸旗。 她就那樣靜靜地躺著,像睡著了一般戚揭。 火紅的嫁衣襯著肌膚如雪诱告。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天民晒,我揣著相機與錄音精居,去河邊找鬼锄禽。 笑死,一個胖子當著我的面吹牛靴姿,可吹牛的內容都是我干的沃但。 我是一名探鬼主播,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼佛吓,長吁一口氣:“原來是場噩夢啊……” “哼绽慈!你這毒婦竟也來了?” 一聲冷哼從身側響起辈毯,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎搜贤,沒想到半個月后谆沃,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡仪芒,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年唁影,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片掂名。...
    茶點故事閱讀 40,096評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡据沈,死狀恐怖,靈堂內的尸體忽然破棺而出饺蔑,到底是詐尸還是另有隱情锌介,我是刑警寧澤,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布猾警,位于F島的核電站孔祸,受9級特大地震影響,放射性物質發(fā)生泄漏发皿。R本人自食惡果不足惜崔慧,卻給世界環(huán)境...
    茶點故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望穴墅。 院中可真熱鬧惶室,春花似錦、人聲如沸玄货。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽松捉。三九已至鹅士,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間惩坑,已是汗流浹背掉盅。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工也拜, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人趾痘。 一個月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓慢哈,卻偏偏與公主長得像,于是被迫代替她去往敵國和親永票。 傳聞我的和親對象是個殘疾皇子卵贱,可洞房花燭夜當晚...
    茶點故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內容

  • 本文整理了60個機器學習算法應用場景實例,含分類算法應用場景20個侣集、回歸算法應用場景20個键俱、聚類算法應用場景10個...
    火禾子_閱讀 1,779評論 0 7
  • 首頁 資訊 文章 資源 小組 相親 登錄 注冊 首頁 最新文章 IT 職場 前端 后端 移動端 數(shù)據(jù)庫 運維 其他...
    Helen_Cat閱讀 3,878評論 1 10
  • 10月第3周復盤 復盤第13周 這周自己從咳嗽轉成重感冒臭埋,每天發(fā)冷穿很多踪央,還是噴嚏不斷,聲音也啞了瓢阴。 娃娃 娃娃們...
    晴天ivory閱讀 193評論 0 0
  • 秋色無邊霞云浮 朝日瞳瞳清光環(huán)滄波瀲滟棹船客側畔何人歌聲傳
    捉刀客王靜閱讀 319評論 0 2
  • 晚餐前畅蹂,例行盛湯。 問小孫女:“苦瓜湯荣恐,你要不液斜?”給她個鬼臉,知道她肯定不喝啦叠穆! 她回我個鬼臉:“不要旗唁!” 阿嬤正...
    Lin太陽閱讀 296評論 0 0