多因子策略之冗余因子

引言:

上一篇文章《多因子選股之有效因子》悯辙,我們講到有效因子的檢驗(yàn)琳省。在選擇了有效因子之后,我們還需要進(jìn)行一步去除冗余因子躲撰。

不同的選股因子可能由于內(nèi)在的驅(qū)動(dòng)因素大致相同等原因针贬,所選出的組合在個(gè)股構(gòu)成和收益等方面具有較高的一致性,因此其中的一些因子需要作為冗余因子剔除拢蛋, 而只保留同類(lèi)因子中收益最好桦他,區(qū)分度最高的一個(gè)因子。例如成交量指標(biāo)和流通量指標(biāo)之間具有比較明顯的相關(guān)性谆棱。流通盤(pán)越大的快压,成交量一般也會(huì)比較大圆仔,因此在選股模型中,這兩個(gè)因子只選擇其中一個(gè)嗓节。

主要步驟:

我參考了網(wǎng)絡(luò)上不同的剔除方法荧缘,但都僅僅淺嘗輒止,沒(méi)有進(jìn)行深入的代碼探究拦宣。我們先說(shuō)剔除冗余因子的主要步驟:

假設(shè)現(xiàn)有k個(gè)因子截粗,回測(cè)周期可分為m個(gè)月,股票可均分為n個(gè)組合鸵隧,

1绸罗、分別按不同因子的大小進(jìn)行排序,講股票分為n個(gè)組合進(jìn)行打分豆瘫,分值與該組合在整個(gè)模型形成期的收益相關(guān)珊蟀,收益越大,分值越高外驱。分值賦給每月該組合內(nèi)的所有個(gè)股育灸。

如果組合10的收益大于組合1,那么就將組合 i 各個(gè)股票的各個(gè)股票分值設(shè)置為 i 昵宇,各個(gè)組合的分值從低到高進(jìn)行排列分別是

1,2,3,4,5,6,7,8,9,10磅崭。如果組合1的收益大于組合10,那么正好是反過(guò)來(lái) 10,9,8,7,6,5,4,3,2,1瓦哎。

2砸喻、按月計(jì)算個(gè)股的不同因子得分間的相關(guān)性矩陣。

3蒋譬、在計(jì)算完每月因子得分相關(guān)性矩陣后割岛,計(jì)算整個(gè)樣本期內(nèi)相關(guān)性矩陣的平均值。

4犯助、設(shè)定一個(gè)得分相關(guān)性閥值癣漆,將得分相關(guān)性平均值矩陣中大于該閥值的元素所對(duì)應(yīng)的因子只保留與其他因子相關(guān)性較小、有效性更強(qiáng)的因子剂买,而其它因子則作為冗余因子剔除扑媚。

測(cè)試參數(shù):

我們根據(jù)步驟,在掘金平臺(tái)上實(shí)現(xiàn)

測(cè)試參數(shù)聲明:

測(cè)試平臺(tái):掘金量化

測(cè)試時(shí)間:2016-01-01——2018-01-01

測(cè)試股票池:“上證50”成分股

測(cè)試因子:

測(cè)試步驟:

1雷恃、獲取每個(gè)月的首個(gè)交易日疆股,月初獲取每只股票的因子數(shù)據(jù)及當(dāng)月收益率,根據(jù)因子數(shù)值排序倒槐,將股票分為10組旬痹,根據(jù)平均收益為股票組合打分,分值賦予對(duì)應(yīng)組合中所有股票。

2两残、分別測(cè)試股票關(guān)于四種因子的分值永毅,根據(jù)每月結(jié)果,計(jì)算相關(guān)性系數(shù)矩陣人弓。

3沼死、計(jì)算整個(gè)測(cè)試周期的相關(guān)性系數(shù)平均值。

4崔赌、設(shè)定閾值意蛀,剔除冗余因子。

結(jié)果:

我們看幾個(gè)月份的相關(guān)性系數(shù)矩陣

2016年3月

2016年4月

2016年6月

2016年10月

2016年12月

2017年6月

再來(lái)看各個(gè)月的統(tǒng)計(jì)表格

我們經(jīng)過(guò)統(tǒng)計(jì)健芭,得出平均相關(guān)性系數(shù)矩陣

結(jié)論:

我們選取的四個(gè)有效因子县钥,平均相關(guān)性系數(shù)均小于0.25,也就是我們選取的因子相關(guān)性很低慈迈,我們可以放心的進(jìn)行因子間的組合若贮,構(gòu)建新的因子。

冗余因子剔除的思想:計(jì)算股票根據(jù)每個(gè)因子的所獲得的分值痒留,通過(guò)比較該分值谴麦,從而得到因子間的相關(guān)性,相關(guān)性高的伸头,剔除其中一個(gè)匾效,留下有效性高并與其他因子相關(guān)性低的因子。

關(guān)聯(lián)閱讀:

1.多因子選股之有效因子

2.多因子選股之策略的實(shí)現(xiàn)? ? ? ?

來(lái)源:掘金量化? ? ? ? 作者:經(jīng)緯量化? 宋瑞迪??

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末熊锭,一起剝皮案震驚了整個(gè)濱河市弧轧,隨后出現(xiàn)的幾起案子雪侥,更是在濱河造成了極大的恐慌碗殷,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件速缨,死亡現(xiàn)場(chǎng)離奇詭異锌妻,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)旬牲,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)仿粹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人原茅,你說(shuō)我怎么就攤上這事吭历。” “怎么了擂橘?”我有些...
    開(kāi)封第一講書(shū)人閱讀 153,116評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵晌区,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng)朗若,這世上最難降的妖魔是什么恼五? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,371評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮哭懈,結(jié)果婚禮上灾馒,老公的妹妹穿的比我還像新娘。我一直安慰自己遣总,他們只是感情好睬罗,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著彤避,像睡著了一般傅物。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上琉预,一...
    開(kāi)封第一講書(shū)人閱讀 49,111評(píng)論 1 285
  • 那天董饰,我揣著相機(jī)與錄音,去河邊找鬼圆米。 笑死卒暂,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的娄帖。 我是一名探鬼主播也祠,決...
    沈念sama閱讀 38,416評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼近速!你這毒婦竟也來(lái)了诈嘿?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,053評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤削葱,失蹤者是張志新(化名)和其女友劉穎奖亚,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體析砸,經(jīng)...
    沈念sama閱讀 43,558評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡昔字,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了首繁。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片作郭。...
    茶點(diǎn)故事閱讀 38,117評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖弦疮,靈堂內(nèi)的尸體忽然破棺而出夹攒,到底是詐尸還是另有隱情,我是刑警寧澤胁塞,帶...
    沈念sama閱讀 33,756評(píng)論 4 324
  • 正文 年R本政府宣布咏尝,位于F島的核電站堂湖,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏状土。R本人自食惡果不足惜无蜂,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望蒙谓。 院中可真熱鬧斥季,春花似錦、人聲如沸累驮。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,315評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)谤专。三九已至躁锡,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間置侍,已是汗流浹背映之。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,539評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蜡坊,地道東北人杠输。 一個(gè)月前我還...
    沈念sama閱讀 45,578評(píng)論 2 355
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像秕衙,于是被迫代替她去往敵國(guó)和親蠢甲。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 多因子模型是應(yīng)用最廣泛的一種選股模型据忘,基本原理是采用一系列的因子作為選股標(biāo)準(zhǔn)鹦牛,滿足這些因子的股票則被買(mǎi)入,不滿足的...
    鴻鵠Max閱讀 1,758評(píng)論 0 0
  • 一鍵克隆代碼 在多因子量化投資體系中勇吊,具有穩(wěn)定的預(yù)期收益曼追,可解釋的經(jīng)濟(jì)驅(qū)動(dòng)理論,與其他因子的低相關(guān)性是選擇alph...
    Ricequant米筐閱讀 3,009評(píng)論 0 8
  • 什么是多因子選股萧福? 玩股票的朋友的朋友應(yīng)該很清楚拉鹃,股市之道無(wú)外乎:選股辈赋、擇時(shí)鲫忍、倉(cāng)控。精通任何一點(diǎn)都可以說(shuō)在股市中所...
    鴻鵠Max閱讀 1,039評(píng)論 0 1
  • https://guorn.com/ 果仁網(wǎng)~ 大家不妨打開(kāi)看看 這次主要想看看計(jì)算機(jī)在量化里面的應(yīng)用钥屈,然后白天自...
    芊小璇閱讀 640評(píng)論 2 1
  • 2016-2017在一家大宗農(nóng)產(chǎn)品B2B公司負(fù)責(zé)產(chǎn)品工作篷就,今年又入職另一家大宗農(nóng)產(chǎn)品B2B公司的產(chǎn)品崗射亏。希望通...
    正在輸入昵稱(chēng)閱讀 332評(píng)論 0 7