均值與方差是我們用來描述一個分布的最常見兩個特征值而咆,回想下計算方差時摇肌,分母為每個觀測值與均值的偏離值平方之和无午,
方差公式
在很多情況下媒役,均值與方差對于描述一個分布的特征來說還是不夠的,這里就要引入矩(moments)的概念宪迟,矩定義如下
矩定義
可以看到方差對應k=2的情況酣衷,而本篇文章就主要來介紹k=3與k=4的情況,此時對應得到的特征值稱為偏度與峰度次泽。
偏度(Skewness)
偏度表示一個分布的對稱情況穿仪,拿正態(tài)分布來說,其概率密度函數(shù)為
正態(tài)分布概率密度函數(shù)
從概率密度函數(shù)就可以看出其圖形應該是關于x=μ對稱的意荤,我們繪制一個均值為0的正態(tài)分布啊片,來證實下這個結論。
正態(tài)分布對稱
如果一個分布不對稱袭异,我們就稱其為偏態(tài)分布钠龙。如果分布中存在一些偏離較大的負數(shù)據(jù),那么就稱為負偏御铃,相反碴里,如果存在偏離較大的正數(shù)據(jù),則稱為正偏上真。
- 對稱的分布咬腋,則其偏度為0
- 正偏的分布,其偏度>0睡互,均值>中位數(shù)>眾數(shù)(出現(xiàn)最多的數(shù)據(jù))
- 負偏的分布根竿,其偏度<0,均值<中位數(shù)<眾數(shù)(出現(xiàn)最多的數(shù)據(jù))
偏度的定義式:
偏度定義式
我們繪制兩個概率函數(shù)就珠,一個正偏一個負偏寇壳,這里我們使用對數(shù)正態(tài)分布(正偏)作為數(shù)據(jù)來源,通過數(shù)據(jù)的方向處理妻怎,就能得到負偏的圖形壳炎。
正偏與負偏
峰度(Kurtosis)
峰度是代表在均值處峰值高低的特征值。對于正態(tài)分布來說逼侦,其峰度稱為常峰度匿辩,所有的正態(tài)分布腰耙,不論均值與方差,其峰度均為3
- 高峰度 峰度>3
- 低峰度 峰度<3
以3為基準铲球,將X-3稱之為超額峰度
使用SciPy庫挺庞,我們繪制一套高峰度、低峰度稼病、常峰度的圖形
示例代碼
示例圖形
峰度的定義公式:
峰度公式
Jarque-Bera檢驗實例
Jarque-Bera檢驗是一個常用的檢驗选侨,它通過對比樣本的峰度與偏度來確定樣本與正態(tài)分布的相似程度。這里我們將對標普500ETF的收益情況進行一次檢驗然走,并得到其P值侵俗。
Jarque-Bera檢驗的原假設是樣本是從符合正態(tài)分布的總體中抽取出來的,如果最終得到的p值小于置信度丰刊,則可以拒絕該假設,相反增拥,則可以接受原假設啄巧。
Jarque-Bera檢驗
注:最終得到標普500ETF的收益情況不符合正態(tài)分布的結論
這篇文章就到這里,感謝閱讀掌栅,歡迎訂閱:)