“人的一切痛苦信不,本質(zhì)上都是對自己無能的憤怒。”
文:藍(lán)兔子讀難NOTES
圖:配圖?來源于網(wǎng)絡(luò)
編碼:0008
[Quantitative Methods]
[Common Probability distribution-2]
因?yàn)槠南拗仆龊牵覀兩弦黄恼轮徽f了一半抽活,在這一篇文章中,我們會(huì)繼續(xù)進(jìn)行常見的概率分布內(nèi)容的分享锰什∠滤叮可以說,在常見概率分布這一大章內(nèi)容里面汁胆,最重要的內(nèi)容就在接下來要說的里面梭姓,一個(gè)是正態(tài)分布(normal distribution),另一個(gè)是t分布(student‘s t-distribution)嫩码,其也是掌握后面章節(jié)內(nèi)容的關(guān)鍵知識(shí)點(diǎn)誉尖。
連續(xù)概率分布與正態(tài)分布
具體連續(xù)概率分布的定義我們在上一篇文章中已經(jīng)進(jìn)行過解釋,這里就不再贅述谢谦。我們直接來看一個(gè)連續(xù)均勻分布(continuous uniform distribution)的PDF圖形:
因?yàn)?b>每一個(gè)可能的結(jié)果發(fā)生的概率是相等的释牺,所以其PDF曲線為一條水平線。這里需要強(qiáng)調(diào)說明一下回挽,由于連續(xù)隨機(jī)變量可以有無數(shù)多個(gè)可能没咙,因此針對某一確定的結(jié)果,我們近似的認(rèn)為其發(fā)生的概率為0千劈,因此在分析連續(xù)隨機(jī)變量相關(guān)問題時(shí)祭刚,我們應(yīng)該取區(qū)間分析,而不能對點(diǎn)進(jìn)行分析墙牌。
又因?yàn)槿魏我粋€(gè)隨機(jī)事件涡驮,其所有可能的結(jié)果的概率和為1,所以上圖中喜滨,該條直線的y軸坐標(biāo)為1/(b-a)捉捅。當(dāng)我們對區(qū)間(a,b)中任何一段子區(qū)間進(jìn)行分析時(shí)虽风,可以利用簡單的幾何原理算出相應(yīng)的面積(概率)棒口。
接下來,就是重中之重的正態(tài)分布辜膝,正態(tài)分布幾乎存在于我們生活的方方面面无牵,無論是班上同學(xué)的考試成績,還是班上同學(xué)的身高體重厂抖,基本上都逃離不了正態(tài)分布的“上帝詛咒”茎毁,而且同一個(gè)目標(biāo)對象的數(shù)量(樣本量)越是多,越是重復(fù)的厲害忱辅,那么就越正態(tài)七蜘√犯龋看看下面這兩幅圖,看看你是否能找到小正態(tài)的影子橡卤。
請別告訴我這是人為的夜只,即便是人為的,為何偏偏就是這個(gè)樣子蒜魄。那到底是哪個(gè)樣子呢,請看下圖:
正態(tài)分布雖然如上帝的“祝赋∏”般占據(jù)了我們生活的方方面面谈为,但是我們只需要把它當(dāng)作一個(gè)工具即可,一把扳手踢关,我們不需要知道它是怎么生產(chǎn)出來的伞鲫,我們只需要了解他的一些性質(zhì)即可:
其PDF完全由均值和方差刻畫,通常記為N(均值签舞,方差)秕脓;
其圖形對稱,偏度為0儒搭,越中間概率越大吠架,越兩端概率越小搂鲫;
如之前內(nèi)容所講傍药,正態(tài)分布的峰度為3,超額峰度為0魂仍;
服從正態(tài)分布的隨機(jī)變量線性組合后還符合正態(tài)分布拐辽;
標(biāo)準(zhǔn)正態(tài)分布概率區(qū)間幾個(gè)特殊值經(jīng)常用要記住,如下圖(90%對應(yīng)1.65個(gè)標(biāo)準(zhǔn)差擦酌,雖然圖中沒標(biāo)俱诸,但也很重要)。
接下來的內(nèi)容是標(biāo)準(zhǔn)化的正態(tài)分布赊舶。如前文所言睁搭,正態(tài)分布表示為N(均值,方差)锯岖,盡管正態(tài)分布存在于我們生活的方方面面介袜,但是這方方面面的正態(tài)分布卻也各不相同,且由于正態(tài)分布的PDF比較復(fù)雜出吹,我們很難通過表達(dá)式去計(jì)算出其某區(qū)間的概率遇伞,更不可能給每一個(gè)參數(shù)不同的正態(tài)分布都列一個(gè)表格去查。
好在前輩們也糾結(jié)過這個(gè)問題捶牢,并且找到了解決方案:他們把標(biāo)準(zhǔn)正態(tài)分布的結(jié)果列成一張表鸠珠,并提供一種把非標(biāo)準(zhǔn)正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布的辦法巍耗,再拿這個(gè)分布去查表。
標(biāo)準(zhǔn)正態(tài)分布表示為N(0,1)渐排,其中0為均值炬太,1為方差,任何非標(biāo)準(zhǔn)正態(tài)分布都可以進(jìn)行轉(zhuǎn)換驯耻,轉(zhuǎn)換后即可查標(biāo)準(zhǔn)正態(tài)分布的表得到相應(yīng)的值亲族。為了便于理解,舉個(gè)例子:
已知某公司股票的某參數(shù)符合正態(tài)分布可缚,其均值為10霎迫,方差為9,即服從N(10帘靡,9)知给,問隨機(jī)抽取該股票參數(shù)中的某個(gè)值,該值小于5的概率描姚,即F(5)涩赢。
雖然其服從正態(tài)分布,但不是標(biāo)準(zhǔn)正態(tài)分布轩勘,所以沒法直接查表筒扒,需要先進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換的方法就是(很重要赃阀,重要霎肯,要):
(X-μ)/σ====即=====>>(5-10)/3
即查標(biāo)準(zhǔn)正態(tài)分布的F((5-10)/3)即可。
查表要注意榛斯,1观游、查表會(huì)不會(huì),不會(huì)的同學(xué)看看書驮俗,這里就不解釋了懂缕;2、查得的是累積概率王凑,可能需要再次進(jìn)行換算搪柑。
標(biāo)準(zhǔn)正態(tài)分布也被稱為z分布或者u分布。
虧空風(fēng)險(xiǎn)(shortfall risk):指資產(chǎn)的收益低于最低可接受水平的概率索烹,虧空風(fēng)險(xiǎn)是一個(gè)概率工碾。這個(gè)最低可接受水平(shortfall level)用Rl表示。
羅伊的第一安全比例(Roy's safety-first ratio | SF ration?):
SF Ratio=[E(Rp)-Rl]/標(biāo)準(zhǔn)差
從其公式上來看百姓,第一安全比例代表的是每份超額風(fēng)險(xiǎn)所獲得的收益渊额,這里的超額指的是投資收益相對于最低要求收益的超額。注意與夏普比率區(qū)分,夏普比率的超額是指投資收益相對于無風(fēng)險(xiǎn)收益超額旬迹。
同夏普比率一樣火惊,每單位風(fēng)險(xiǎn)獲得的收益肯定是越多越好,所以怎么根據(jù)SF ratio選擇組合你懂的奔垦。
對數(shù)正態(tài)分布與t分布
接下來是另一個(gè)非常重要的分布屹耐,學(xué)生t分布(student t-distribution),不要覺得名字奇怪椿猎,之所以叫這個(gè)名字惶岭,只是因?yàn)榘l(fā)表的人給自己取了個(gè)這么樣的筆名而已。就像正態(tài)分布也叫高斯分布一樣犯眠,只是名字而已俗他。
不過說到正態(tài)分布和t分布,他們不僅僅是名字都是發(fā)表者用的名字而已阔逼,他們還有很多的相似之處。怎么個(gè)相似法呢地沮,先看圖:
我們之前說過嗜浮,正態(tài)分布的樣本數(shù)量越多,就越正態(tài)分布摩疑。以考試成績?yōu)槔H冢粋€(gè)班50個(gè)同學(xué)的數(shù)據(jù)肯定沒有全校同學(xué)的數(shù)據(jù)那么“正態(tài)”。但是如果反過來雷袋,班上只有40個(gè)同學(xué)吉殃,或者只有10個(gè)同學(xué),他們的成績還符合正態(tài)分布嗎楷怒?不難想象蛋勺,當(dāng)我們數(shù)據(jù)量越小時(shí),越容易受到極端值的影響鸠删,當(dāng)數(shù)據(jù)量太少時(shí)抱完,就會(huì)和正態(tài)分布出現(xiàn)偏差。
我們有一位偉大的同學(xué)刃泡,叫做“Student”巧娱,同我們一樣,他也發(fā)現(xiàn)了這個(gè)現(xiàn)象烘贴,但是和我們不一樣的是禁添,人家找到了小樣本的解決方案,后來被命名成t分布桨踪。t分布具有如下性質(zhì):
圖形如上圖所示老翘,當(dāng)自由度增大時(shí),圖形逐步接近于正態(tài)分布;
圖形完全由自由度(degrees of freedom | df )刻畫酪捡;
相比于正態(tài)分布叁征,t分布圖形有低峰肥尾巴特質(zhì),因此峰度>3逛薇;
這里說明一下,峰態(tài)雖然叫做“峰”態(tài)永罚,但他看的不是峰有多高啤呼,而是尾巴有多肥。
下面是對數(shù)正態(tài)分布(lognormal distribution)呢袱,雖然正態(tài)分布占據(jù)了我們生活的方方面面官扣,但是他卻有一個(gè)問題:他的取值范圍在正負(fù)無窮的范圍內(nèi),而我們的資產(chǎn)羞福,或者說股票的價(jià)格惕蹄,不可能為負(fù),所以導(dǎo)致其不能用于衡量資產(chǎn)的價(jià)格治专。因此卖陵,我們引入了對數(shù)正態(tài)分布(具體的過程比較有意思,但是這里不說)张峰,如下圖:
其有如下特點(diǎn):
非負(fù)性泪蔫,符合資產(chǎn)股票的價(jià)格定義域,偏度為正喘批,所以一般用正態(tài)分布來衡量資產(chǎn)的風(fēng)險(xiǎn)撩荣,而用對數(shù)正態(tài)分布來衡量資產(chǎn)的價(jià)格。
最后還有一個(gè)知識(shí)點(diǎn)饶深,叫做多元分布(multivariate distribution)餐曹,這里大家不用詳細(xì)了解,只知道多元分布就像多元方程一樣敌厘,里面有多個(gè)元素凸主。考試一般問你需要幾個(gè)參數(shù)才能刻畫出這個(gè)多元分布额湘,只要記住以下內(nèi)容就OK:
每一個(gè)元需要兩個(gè)參數(shù)來刻畫:一個(gè)均值卿吐,一個(gè)方差;
每兩個(gè)元之間需要一個(gè)相關(guān)系數(shù)來刻畫锋华,nC2嗡官;
所以,假設(shè)有n元毯焕,需要的參數(shù)就是2*n+nC2衍腥,掏出你的計(jì)算器吧磺樱!
模擬
模擬就是通過事前對事情進(jìn)行彩排,來預(yù)測和發(fā)現(xiàn)事情的發(fā)展方向婆咸,比如去面試前竹捉,你會(huì)進(jìn)行一個(gè)模擬面試,考慮會(huì)有哪些問題尚骄,如何應(yīng)對块差。
模擬有兩種,以面試為例倔丈,很多人都有面試過憨闰,自己可能也面試過多次,面試的常見套路需五,問題基本上就那些鹉动,你模擬的時(shí)候,你就能知道大概會(huì)問哪些問題宏邮,雖然每次面試不一樣泽示,但是大差不差,你可以假設(shè)一種情景來分析蜜氨,如果問這個(gè)問題怎么樣边琉,如果問那個(gè)問題怎么樣。這就是蒙特卡羅模擬(Monte Carlo simulation)记劝,我們也稱之為情景模擬,對解決如果咋的咋的(what if)問題很有效族扰。實(shí)際上厌丑,你就需要先假設(shè)這么一個(gè)如果(通常假設(shè)其符合某一分布),但是其缺陷是渔呵,你一旦假設(shè)都錯(cuò)了怒竿,那你就全盤皆輸。而且這種計(jì)算費(fèi)電腦扩氢。
還有一個(gè)叫做歷史模擬(historical simulation)耕驰,就是根據(jù)歷史數(shù)據(jù)來模擬,比如搜集某個(gè)地方某一天過去100年的天氣情況來預(yù)測以后的天氣情況录豺,由于其依賴歷史數(shù)據(jù)朦肘,所以不能進(jìn)行情景分析,如果(what if)氣象局搞了場人工降雨呢双饥?而且時(shí)代在進(jìn)步媒抠,萬事萬物都是在變,沒有什么是一成不變的咏花,所以歷史模擬也存在問題趴生。還有就是,你選的這段歷史數(shù)據(jù)萬一碰巧選到特殊的一段了,比如模擬經(jīng)濟(jì)發(fā)展苍匆,你剛好選到二戰(zhàn)那一段呢刘急?所以,我們通常進(jìn)行樣本外測試(out of sample test)浸踩,把數(shù)據(jù)拿到樣本外的歷史數(shù)據(jù)去試試叔汁,排除數(shù)據(jù)選擇問題(是那一段時(shí)間獨(dú)有的)。
兔紙的相關(guān)文章
CFA一級數(shù)量分析-貨幣的時(shí)間價(jià)值