一.簡介
Kolmogorov-Smirnov是比較一個累計分布(cumulative distribution function)函數(shù)與經(jīng)驗分布函數(shù)(empirical distribution function)二者的觀測值偏差K-S statistic(檢驗統(tǒng)計量)是否在一定范圍方法弥雹;如在一定范圍,則原函數(shù)屬于某一特定的概率分布脓魏。
累計分布(cumulative distribution function):把所有的observation排序剃毒,得到只估,那么
霸株,其中n為樣本個數(shù)诸衔,i為每個樣本的值盯漂。
經(jīng)驗分布(empirical distribution function):通過查表得到。
K-S statistic(檢驗統(tǒng)計量):
二.實例
單樣本實例
我們有10個數(shù)據(jù)點:
108笨农, 112就缆, 117, 130谒亦, 111违崇, 131, 113诊霹, 113羞延, 105, 128脾还。我們想知道伴箩,這些點是否來自平均值是120,標(biāo)準(zhǔn)差是10的正態(tài)分布鄙漏?120嗤谚,10大致為本組數(shù)據(jù)的平均值與標(biāo)準(zhǔn)差。
1.排序
105怔蚌, 108巩步,111,112桦踊, 113椅野, 113, 117, 128竟闪, 130离福, 131
2.計算累計分布和經(jīng)驗分布(查表得到)的差值
差值的最大值是0.358。 從表格(見附錄)中可以查出炼蛤,在?α=0.10的時妖爷,critical value是0.37。因為0.358<0.37,所以這些點來自平均值是120理朋,標(biāo)準(zhǔn)差是10的正態(tài)分布絮识。
多樣本實例
有以下兩組樣本:
X:1.2, 1.4嗽上, 1.9次舌, 3.7, 4.4炸裆,4.8垃它,9.7鲜屏,17.3烹看,21.1,28.4
Y:5.6洛史,6.5惯殊,6.6,6.9也殖,9.2土思,10.4,10.6忆嗜,19.3
1.把兩組樣本合在一塊己儒。
2.進(jìn)行排序。
3.計算計算累計分布和經(jīng)驗分布的差值捆毫。
這里?
對于兩樣本闪湾,95%的critical value的計算公式為:
1.36也是查表得到的。
因為0.6<0.645绩卤,所以兩組樣本的分布一樣途样。
參考:
https://zhuanlan.zhihu.com/p/292678346
https://zhuanlan.zhihu.com/p/146781665