在數(shù)據(jù)分析中如果某個(gè)數(shù)據(jù)服從正態(tài)分布的話闹司,我們可以利用正態(tài)分布的性質(zhì)做出很多有意義的分析娱仔,例如t-檢驗(yàn)。游桩。
如何檢驗(yàn)樣本是否服從正態(tài)分布牲迫?
可以使用Q-Q圖來進(jìn)行檢驗(yàn),Q-Q圖是一個(gè)散點(diǎn)圖借卧,點(diǎn)(x, y)表示數(shù)據(jù)x的某個(gè)分位數(shù)盹憎,y表示和x的分位數(shù)相同的分位數(shù)(即 $ F_X (x)=F_Y(y) $ ),如果說兩個(gè)分布的QQ圖在一條直線上铐刘,則說明每個(gè)$[x_i, x_{i+1}]陪每,[y_i, y_{i+1}]$區(qū)間所包含的數(shù)據(jù)在整個(gè)數(shù)據(jù)集中的比例相同,也就是說明如果對(duì)x或y進(jìn)行放縮的話可以讓它們镰吵。
所以檩禾,如果把未知數(shù)據(jù)和標(biāo)準(zhǔn)正態(tài)分布做Q-Q圖的話,如果所有點(diǎn)在一條直線上則說明未知數(shù)據(jù)的分布服從正態(tài)分布疤祭。
如果不是正態(tài)分布怎么辦盼产?
數(shù)據(jù)右偏的話可以對(duì)所有數(shù)據(jù)取對(duì)數(shù)、取平方根等勺馆,它的原理是因?yàn)檫@樣的變換的導(dǎo)數(shù)是逐漸減小的戏售,也就是說它的增速逐漸減緩,所以就可以把大的數(shù)據(jù)向左移草穆,使數(shù)據(jù)接近正態(tài)分布灌灾。
如果左偏的話可以取相反數(shù)轉(zhuǎn)化為右偏的情況。