華爾街的礦工們通過機(jī)器學(xué)習(xí)來降低訂單的市場沖擊

對于Buy Side的礦工(quant)來說蛆橡,由于其交易體量太過巨大祠够,一個重要的研究內(nèi)容就是如何能夠理解和掌握自己公司的交易對市場價格的影響耀石,也就是所謂的“市場沖擊”,并把這種沖擊降低到最低硬爆。很多時候人們都把大額的交易比作“把大象推入游泳池” 欣舵,避免市場沖擊就自然被比作避免“大象入水”的水花了。

過去人們?nèi)绻胍私庖粋€大額交易可能會帶來的市場沖擊缀磕,一般會從歷史的交易數(shù)據(jù)中尋找答案缘圈。但是當(dāng)大家仔細(xì)研究就會發(fā)現(xiàn),歷史上的交易很少能夠有很類似的結(jié)果/影響袜蚕,而且即使新交易和過往交易之間存在相似之處或一定的模式糟把,有時候這種關(guān)系也過于微妙或變化太快,以至于交易者很難發(fā)現(xiàn)和把握牲剃。

正因?yàn)槿绱饲卜瑁愃朴谂聿˙loomberg),摩根大通(JP Morgan)和Portware等公司已經(jīng)轉(zhuǎn)向機(jī)器學(xué)習(xí)模型尋求答案凿傅。負(fù)責(zé)摩根大通歐洲缠犀、中東和非洲的算法研究負(fù)責(zé)人David Fellah表示:“只有當(dāng)我們具備了硬件技術(shù),更快的機(jī)器學(xué)習(xí)算法聪舒,以及對市場沖擊的作用模式的更好理解之后辨液,我們才能夠把這些因素綜合起來并加以運(yùn)用∠洳校”

機(jī)器學(xué)習(xí)算法可以從幾個方面幫助礦工(Quant)們解決“大象入水”的水花問題滔迈。一方面,它可以對傳統(tǒng)的市場沖擊模型起到補(bǔ)充作用。比如說人工智能算法可以幫助人們從稀疏歷史數(shù)據(jù)中擠出更多信息亡鼠,或幫助人們確定訂單流(Order Flow)中的非線性關(guān)系。

另一方面敷待,在更大膽的應(yīng)用下间涵,機(jī)器學(xué)習(xí)算法可以用來創(chuàng)造出交易機(jī)器人。這些機(jī)器人可以教會自己如何對市場變化做出反應(yīng)榜揖。這兩種方法都已經(jīng)在實(shí)踐中被應(yīng)用了勾哩,而它們所帶來的交易成本的節(jié)省是十分驚人的,尤其是對那些交易非常頻繁的大型基金举哟。

據(jù)Capital Fund Management研究主管Jean-Philippe Bouchaud介紹思劳,對一個系統(tǒng)性基金來說,市場沖擊帶來的成本可能會侵蝕掉多達(dá)三分之二的交易收益妨猩。一名對沖基金的訂單執(zhí)行專家說潜叛,該基金每年由不利市場沖擊帶來的成本達(dá)到約100萬美元,約占稅前利潤的十分之一壶硅。

摩根大通的Fellah同時表示威兜,交易員業(yè)績表現(xiàn)的上限和下限之間通常也只有兩個基點(diǎn)(bps):“如果你可以把一個算法的表現(xiàn)提高哪怕幾分之一個基點(diǎn),你的收益就會有很大的不同庐椒〗范妫” 這主要是由于目前市場上由算法交易的訂單數(shù)量占絕對多數(shù)的原因。

目前主流的機(jī)器學(xué)習(xí)技術(shù)包括聚類分析(無監(jiān)督學(xué)習(xí))约谈,貝葉斯回歸笔宿,隨機(jī)森林和強(qiáng)化學(xué)習(xí)等監(jiān)督學(xué)習(xí)技術(shù)。聚類分析(Cluster analysis)首先在70多年前作為寬泛的統(tǒng)計(jì)技術(shù)被開發(fā)出來棱诱,用于識別復(fù)雜數(shù)據(jù)中難以覺察的相似之處泼橘。貝葉斯回歸(Bayesian regression)和隨機(jī)森林(Random Forest)是預(yù)測技術(shù),給出既定場景的出現(xiàn)概率军俊。強(qiáng)化學(xué)習(xí)的目的是通過許多模擬來訓(xùn)練所謂的人工智能(AI)單元侥加,以在特定的情境下選擇最佳的行動方式。

雖然這些技術(shù)本身并不新鮮粪躬,但隨著人類計(jì)算能力和可用數(shù)據(jù)量的不斷增加担败,它們的應(yīng)用場景也不斷增加。當(dāng)然人們對市場沖擊和人工智能的理論認(rèn)識不斷向前邁進(jìn)镰官,也是其應(yīng)用越來越廣泛的原因提前。

彭博正在使用聚類分析來填補(bǔ)用于校準(zhǔn)傳統(tǒng)參數(shù)模型的數(shù)據(jù)的空白。這些看起來很基礎(chǔ)的模型仍然在行業(yè)中占主導(dǎo)地位泳唠。雖然與之一起使用的已經(jīng)是很復(fù)雜的工具了狈网,但這些模型還是被迫依賴于稀疏的歷史數(shù)據(jù)。例如彭博的流動性評估工具——LQA。它首先將債券分成直觀上類似的大類組合拓哺,然后應(yīng)用聚類分析確定每個大類中最為可比的產(chǎn)品勇垛。每種債券都是根據(jù)一系列共同特征進(jìn)行定量測量的,例如貨幣種類士鸥,期限闲孤,到期日和未償還金額。這些衡量指標(biāo)確定某一個債券在多維向量空間內(nèi)的位置烤礁。

例如讼积,交易500手的一種不活躍的美國國債(obscure bond),LQA將在多維向量空間內(nèi)尋找與該國債“距離最近”也就是最為相似的債券脚仔。 然后LQA將使用它們的組合數(shù)據(jù)池來校準(zhǔn)模型參數(shù)勤众,從而達(dá)到解決歷史數(shù)據(jù)稀疏的問題。

最初鲤脏,彭博自己嘗試了聚類分析们颜,在聚類上構(gòu)造線性回歸模型以估計(jì)預(yù)期成本。但這并沒有給他們帶來預(yù)期當(dāng)中的結(jié)果猎醇。單純的聚類分析很容易導(dǎo)致不穩(wěn)定性掌桩,數(shù)據(jù)的微小變化就可能會帶來聚類組合的意外變化。于是姑食,彭博認(rèn)識到了需要引入一個參數(shù)模型來增加模型的穩(wěn)定性波岛。

Bloomberg的量化研究負(fù)責(zé)人Naz Quadri說:“聚類分析在某些應(yīng)用中比其他應(yīng)用更有效∫舭耄“我們的研究表明则拷,當(dāng)用來評估結(jié)構(gòu)性市場沖擊時,聚類分析是最有用的曹鸠,結(jié)果也更加穩(wěn)定煌茬。”

與彭博不同彻桃,Portware和摩根大通則通過人工智能來更好的協(xié)助交易員選擇交易的具體時機(jī)坛善,以最大限度地減少市場沖擊帶來的影響。

Portware和摩根大通兩家的市場沖擊模型邻眷,都是從刻畫歷史交易對當(dāng)前交易的市場沖擊的影響作為起點(diǎn)眠屎。例如,在摩根大通的瞬時模型(transient model)中肆饶,每個交易的市場沖擊隨著時間的推移而逐漸減弱改衩。這樣建模的目的是避免將交易安排得太緊密,從而導(dǎo)致訂單疊加的市場沖擊過大驯镊。

這樣的模型對流動性好的資產(chǎn)(如股票)效果很好葫督,但其他資產(chǎn)類別可能就沒有這么容易了竭鞍。 Quadri表示:“我知道一些公司試圖將瞬時模型應(yīng)用在固定收益產(chǎn)品上,但是看起來在流動性較低的證券中不盡如人意橄镜≠丝欤”

這些模型被公司用來制定不同情境下的最優(yōu)交易安排方案,然后使用貝葉斯回歸或隨機(jī)森林等監(jiān)督學(xué)習(xí)技術(shù)來決定如何隨著實(shí)際交易進(jìn)度來調(diào)整這些最優(yōu)的交易實(shí)施方案洽胶。

例如滨砍,Portware的貝葉斯回歸方法可以隨著交易的進(jìn)行,使用多個人工智能單元來同時預(yù)測短期波動率妖异,訂單流和交易量。模型的輸入變量包括市場數(shù)據(jù)领追,新聞和社交媒體數(shù)據(jù)他膳。

Portware的研究主管Henri Waelbroeck說:“訂單流的不平衡性實(shí)際上是相當(dāng)可預(yù)測的。通過自回歸模型可以預(yù)測到足夠合理的精確度绒窑,但是我們發(fā)現(xiàn)使用非線性方法可以更進(jìn)一步地提高準(zhǔn)確性棕孙。”

Portware系統(tǒng)中的人工智能單元給出訂單流的預(yù)測些膨,并進(jìn)一步預(yù)測交易中面臨的風(fēng)險蟀俊,如交易的緊急性(urgency,是用來衡量更快速的交易如何能夠降低成本的一種指標(biāo))订雾。由于這些預(yù)測都存儲在系統(tǒng)的內(nèi)存中肢预,每個單元都可以使用其他單元的預(yù)測來強(qiáng)化自己的結(jié)果。

隨著交易的進(jìn)行洼哎,如果訂單流烫映,波動率或交易量偏離預(yù)期,Portware的系統(tǒng)將提醒交易員是否需要切換訂單執(zhí)行算法噩峦。市場沖擊模型進(jìn)而計(jì)算這些算法的預(yù)期執(zhí)行成本锭沟,并與其他預(yù)先訓(xùn)練好的人工智能單元的結(jié)果進(jìn)行比較。

摩根大通的Fellah表示识补,由于缺少流動性族淮,一般而言每30次操作(提交限價訂單,修訂或是取消)才能實(shí)現(xiàn)一單交易凭涂。如果計(jì)算時間太長祝辣,調(diào)整訂單后被發(fā)送到訂單序列靠后的位置,那么自然效率就會很低切油。

摩根大通使用隨機(jī)森林算法來產(chǎn)生短期訂單流的預(yù)測较幌,這意味著訂單操作(修改、取消白翻、提交)的數(shù)量可以大大減少乍炉。 Fellah說绢片,隨機(jī)森林算法因?yàn)槠溆?jì)算的速度快而被選中。

他的團(tuán)隊(duì)還對機(jī)器學(xué)習(xí)的另一個可能的應(yīng)用進(jìn)行研究和測試岛琼,期望使用強(qiáng)化學(xué)習(xí)來訓(xùn)練一個單一的人工智能單元對限價訂單中的訂單不平衡和排隊(duì)位置做出反應(yīng)底循。

他們通過模擬生成限價訂單簿,然后人工智能單元將使用這些虛擬的訂單簿來優(yōu)化其交易安排槐瑞。其訂單的市場沖擊由瞬時模型來刻畫熙涤,大量的模擬樣本可以使人工智能單元“學(xué)習(xí)”交易是如何導(dǎo)致市場沖擊的。

“如果你考慮強(qiáng)化學(xué)習(xí)算法(re-inforcement learning)是怎么用于自動駕駛或游戲的就應(yīng)該知道困檩,這些算法必須了解其運(yùn)行系統(tǒng)的原理祠挫。從這點(diǎn)上來說,在金融領(lǐng)域也是一樣的悼沿〉忍颍”Fellah說。

這里的基本思路是通過這些模擬的框架來訓(xùn)練人工智能單元或機(jī)器人糟趾,使其能夠做出最佳的選擇和行動慌植。大量的訓(xùn)練可以使人工智能單元具備了解交易如何引起市場沖擊,以及這種沖擊如何隨時間而衰退的直覺义郑。人工智能單元從而具備了判斷何時延遲訂單或以更快的速度進(jìn)行交易的能力蝶柿。

“這種方法的一個好的地方是我們不需要寫代碼。從某種意義上說非驮,機(jī)器自己“寫”算法”交汤,F(xiàn)ellah說。

使用機(jī)器學(xué)習(xí)來評估市場沖擊的這些成功案例正在促進(jìn)進(jìn)一步的研究劫笙。例如蜻展,Waelbroeck說他的公司正在尋求將其短期預(yù)測技術(shù)擴(kuò)展到長期投資組合風(fēng)險管理。他說:“這可能對我們來說還有一段路要走邀摆。但是纵顾,我們正在探索這套系統(tǒng)作為投資組合風(fēng)險管理的一種不同方法的可能性。它可以幫助投資組合經(jīng)理從資產(chǎn)組合配置的角度更好地為未來的市場沖擊做準(zhǔn)備栋盹。這些市場沖擊往往僅從相關(guān)性的角度來看并不能很好的確定其風(fēng)險施逾。”

當(dāng)然例获,有些礦工(quant)對機(jī)器學(xué)習(xí)可以帶來多大的幫助持懷疑態(tài)度汉额。Alliance Bernstein的研究主管Nataliya Bershova表示,她更傾向于依靠參數(shù)模型(parametric models):“舉例來說榨汤,通過機(jī)器學(xué)習(xí)蠕搜,你不能說一個因子X比因子Y更有影響力。這只是一個黑匣子收壕,告訴你它的非參數(shù)模型可以更好地擬合真實(shí)數(shù)據(jù)妓灌。通過大多數(shù)機(jī)器學(xué)習(xí)技術(shù)轨蛤,你并不能清楚地分離永久性影響和暫時性影響。而在參數(shù)模型中你是可以的虫埂。這是一個很重要的功能祥山。”

與此同時掉伏,Capital Fund Management的Bouchaud認(rèn)為缝呕,低頻機(jī)器學(xué)習(xí)可用的分析數(shù)據(jù)太少,因此機(jī)器學(xué)習(xí)帶來的好處有限斧散」┏#“如果有非線性效應(yīng),機(jī)器學(xué)習(xí)是有趣的鸡捐。而如果一切都是線性的栈暇,你可以做線性回歸就夠了〈巢危”

在低頻下,數(shù)據(jù)太有限以至于無法避免出現(xiàn)誤導(dǎo)性結(jié)果(misleading results)悲立,過度抽樣(oversampling)鹿寨,過度擬合(overfitting)。Bouchaud說:“所有的機(jī)器學(xué)習(xí)算法能夠發(fā)現(xiàn)的低頻數(shù)據(jù)中的非線性特征薪夕,我們都已經(jīng)通過更傳統(tǒng)的數(shù)據(jù)分析方法或直覺捕捉到了脚草。”

但高頻交易是不同的原献,他認(rèn)為馏慨。 “在幾秒鐘或幾分鐘的高頻率范圍內(nèi),通常有足夠的數(shù)據(jù)姑隅,使得機(jī)器學(xué)習(xí)算法提供的對相關(guān)性的自動搜索可以帶來幫助写隶。”

Waelbroeck對機(jī)器學(xué)習(xí)可以幫助低頻交易則更樂觀讲仰,并且認(rèn)為機(jī)器學(xué)習(xí)具備幫助解決遠(yuǎn)遠(yuǎn)超出市場沖擊問題的潛力慕趴。當(dāng)市場處于壓力之中時,(資產(chǎn)價格)相關(guān)性結(jié)構(gòu)就會發(fā)生變化鄙陡。風(fēng)險管理者依靠先前的類似壓力事件的相關(guān)性來估計(jì)這種變化冕房。他認(rèn)為這是最糟糕的預(yù)測方法,也是一個機(jī)器學(xué)習(xí)可以起作用的地方趁矾。

“更先進(jìn)的方法是能夠識別過去事件中哪些特點(diǎn)在今天最有可能保持不變耙册。下一次危機(jī)不會是ABS市場崩潰的重復(fù),但是對于過去的危機(jī)來說毫捣,有些真相仍然將會存在详拙,并且可以幫助預(yù)測下一次危機(jī)如何展開帝际。機(jī)器學(xué)習(xí)可以幫助揭露這些真相∠澹”

【注】文章首發(fā)于公眾號“量化風(fēng)險研究”胡本,公眾號ID:RiskQuant。轉(zhuǎn)載請注明畸悬。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末侧甫,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子蹋宦,更是在濱河造成了極大的恐慌披粟,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,366評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件冷冗,死亡現(xiàn)場離奇詭異守屉,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)蒿辙,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評論 3 395
  • 文/潘曉璐 我一進(jìn)店門拇泛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人思灌,你說我怎么就攤上這事俺叭。” “怎么了泰偿?”我有些...
    開封第一講書人閱讀 165,689評論 0 356
  • 文/不壞的土叔 我叫張陵熄守,是天一觀的道長。 經(jīng)常有香客問我耗跛,道長裕照,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,925評論 1 295
  • 正文 為了忘掉前任调塌,我火速辦了婚禮晋南,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘羔砾。我一直安慰自己搬俊,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,942評論 6 392
  • 文/花漫 我一把揭開白布蜒茄。 她就那樣靜靜地躺著唉擂,像睡著了一般。 火紅的嫁衣襯著肌膚如雪檀葛。 梳的紋絲不亂的頭發(fā)上玩祟,一...
    開封第一講書人閱讀 51,727評論 1 305
  • 那天,我揣著相機(jī)與錄音屿聋,去河邊找鬼空扎。 笑死藏鹊,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的转锈。 我是一名探鬼主播盘寡,決...
    沈念sama閱讀 40,447評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼撮慨!你這毒婦竟也來了竿痰?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,349評論 0 276
  • 序言:老撾萬榮一對情侶失蹤砌溺,失蹤者是張志新(化名)和其女友劉穎影涉,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體规伐,經(jīng)...
    沈念sama閱讀 45,820評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡蟹倾,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,990評論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了猖闪。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片鲜棠。...
    茶點(diǎn)故事閱讀 40,127評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖培慌,靈堂內(nèi)的尸體忽然破棺而出豁陆,到底是詐尸還是另有隱情,我是刑警寧澤检柬,帶...
    沈念sama閱讀 35,812評論 5 346
  • 正文 年R本政府宣布献联,位于F島的核電站竖配,受9級特大地震影響何址,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜进胯,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,471評論 3 331
  • 文/蒙蒙 一用爪、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧胁镐,春花似錦偎血、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,017評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至就缆,卻和暖如春帖渠,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背竭宰。 一陣腳步聲響...
    開封第一講書人閱讀 33,142評論 1 272
  • 我被黑心中介騙來泰國打工空郊, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留份招,地道東北人。 一個月前我還...
    沈念sama閱讀 48,388評論 3 373
  • 正文 我出身青樓狞甚,卻偏偏與公主長得像锁摔,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子哼审,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,066評論 2 355

推薦閱讀更多精彩內(nèi)容