數(shù)學师逸、統(tǒng)計學或者機器學習如何能夠幫助我們提升交易分析的效率?——智能投研豆混。
這個問題比寄希望于讓人工智能來代替我們交易會更有意義篓像,至少目前是這樣。在很多領域皿伺,深度學習似乎做得不錯员辩,但無論是學習的效率,還是學習的本質(zhì)鸵鸥,AI較人類還差得太遠太遠奠滑,更不用說,投資這種人類本身都說不清楚是科學還是藝術(shù)的事情妒穴。
投資里宋税,我們最常見的數(shù)據(jù)是交易的時間序列,最常見的數(shù)據(jù)集是日線OHLCV數(shù)據(jù)讼油。
時間序列分析屬于統(tǒng)計學的范疇杰赛,無論是一維的時間序列還是多元時間序列分析,都在統(tǒng)計系的范圍以內(nèi)矮台。但由于與經(jīng)濟學關(guān)聯(lián)很深乏屯,一般作為計量經(jīng)濟學的重要組成基礎。
Quant本身可以分兩大類:
金融與計量經(jīng)濟領域的quant偏向于時間序列分析——需要的數(shù)據(jù)量相對較少瘦赫,所以一般量化投資從時間序列分析開始辰晕。
機器學習是另一種做quant的手段,與時間序列分析是并列的一種手段耸彪。
時間序列有兩種模式伞芹,一是均值回歸; 二是趨勢跟隨(動量效應)。
均值回歸:如果時間序列是平穩(wěn)的唱较,有一個均值扎唾,產(chǎn)品價格圍繞均值操作。如果時間序列是隨機游走南缓,下一刻的狀態(tài)沒法根據(jù)過往判斷胸遇,與過往價格是獨立的,那就沒法在證券市場構(gòu)建統(tǒng)計模型賺錢汉形。單只股票的價格很可能就是隨機游走的纸镊。但是一個股票組合,可能不是隨機游走(平穩(wěn))的概疆,也就有了研究的必要逗威。——可以通過統(tǒng)計方式岔冀,構(gòu)建一個“平穩(wěn)”的“套利”投資組合凯旭。
時間序列里,有趨勢使套、周期罐呼、自相關(guān)性,剩下就是隨機游走侦高。
平穩(wěn)性(stationarity)是時間序列分析的基礎嫉柴。嚴格平衡,說白了就是收益率來自于同一個概率分布:對于所有的??奉呛,??的概率分布都是一樣的计螺、不隨時間變化。這樣的時間序列??就是(嚴格)平穩(wěn)的侧馅。但這個條件太嚴格了危尿,一般我們關(guān)注弱平穩(wěn),即均值與方差具備(二階)平穩(wěn)性馁痴。但即便是弱平穩(wěn),金融時間序列要達到標準也不容易肺孤。因此罗晕,我們需要把時間跨度縮短或者通過更復雜的非線性模型對波動率進行建模(比如 GARCH)。
更加高級的時間序列模型來對自相關(guān)性建模赠堵。在這方面小渊,自回歸模型(AR)和滑動平均模型(MA),以及它們二者的組合 —— 自回歸滑動平均模型(ARMA) —— 都是非常有力的工具茫叭。
P階自回歸酬屉,很好理解,就是當期收益率,使用過去P期來線性擬合:
ARIMA模型是在ARMA模型的基礎上解決非平穩(wěn)序列的模型呐萨,因此在模型中會對原序列進行差分杀饵。
基于時間序列的分析應用于量化投資符合直覺。因為我們首先獲得的就是時間序列相關(guān)數(shù)據(jù)谬擦,技術(shù)分析的金融基本假設也是歷史可以重演切距,就是歷史中含有未來可以重現(xiàn)的模式,若是如此惨远,則時間序列的分析模型會很有用谜悟。
但事實在,不要指望一個指標或者模型直接解決問題北秽,而是幫我們更好地理解數(shù)據(jù)葡幸。
比如歷史收益率只是一個方面,那么結(jié)合估值情況呢贺氓?結(jié)合RSRS指標呢蔚叨。
(公眾號: 七年實現(xiàn)財富自由(ailabx),思想者掠归,行動派缅叠;用數(shù)字說基金,用基金做投資組合虏冻,踐行財富自由之路)