檢驗正態(tài)分布方法的匯總

在數(shù)據(jù)分析過程中,往往需要數(shù)據(jù)服從正態(tài)分布靴患,正態(tài)分布仍侥,也稱“常態(tài)分布”,又名高斯分布鸳君,在求二項分布的漸近公式中得到。很多方法都需要數(shù)據(jù)滿足正態(tài)分布患蹂,比如方差分析或颊、獨立t檢驗、線性回歸分析(因變量)等传于。如果說沒有這個前提可能會導(dǎo)致分析不嚴謹?shù)鹊却烟簟K赃M行數(shù)據(jù)正態(tài)性檢驗很重要。那么如何進行正態(tài)性檢驗沼溜?接下來進行說明平挑。


一、檢驗方法

SPSSAU共提供三種正態(tài)性檢驗的方法系草,分別是描述法通熄、正態(tài)性檢驗以及圖示法,其中圖示法包括直方圖以及P-P/Q-Q圖找都。



1.1描述法


理論上講唇辨,標(biāo)準(zhǔn)正態(tài)分布偏度和峰度均為0,但現(xiàn)實中數(shù)據(jù)無法滿足標(biāo)準(zhǔn)正態(tài)分布能耻,因而如果峰度絕對值小于10并且偏度絕對值小于3赏枚,則說明數(shù)據(jù)雖然不是絕對正態(tài),但基本可接受為正態(tài)分布晓猛。從上表可以看出例子中峰度為1.160絕對值小于10饿幅,偏度為-1.084絕對值小于3。說明數(shù)據(jù)基本可以接受為正態(tài)分布戒职。


1.2 正態(tài)性檢驗

SPSSAU的正態(tài)性檢驗包括三種:正態(tài)性shapro-WiIk檢驗栗恩、正態(tài)性Kolmogorov-Smirnov檢驗和Jarque-Bera檢驗。

背景簡單描述:調(diào)查一個班級的53名學(xué)生的身高帕涌,判斷搜集的數(shù)據(jù)是否滿足μ=140.79摄凡,σ=8.6的正態(tài)分布续徽。

由于n>50,所以檢驗方法選擇K-S檢驗或者J-B檢驗。如果利用K-S檢驗進行證明亲澡,步驟如下:


H0:x服從μ=140.79钦扭,σ=8.6的正態(tài)分布

H1:x不服從μ=140.79,σ=8.6的正態(tài)分布

附表如下:

(圖片來源于:網(wǎng)絡(luò)侵刪)

因為樣本超過35床绪,并且α=0.05客情,所以D約為1.36/

≈0.187;

相應(yīng)指標(biāo)

首先計算K-S檢驗中的D統(tǒng)計量癞己,計算公式如下:

【D=max left{D^{+}, D^{-} ight}】

【D^{+}=left|F_{n}left(x_{(k)} ight)-F_{0}left(x_{(k)} ight) ight|】

【D^{-}=left|F_{n}left(x_{(k)} ight)-F_{0}left(x_{(k-1)} ight) ight|】


首先將數(shù)據(jù)按從小到大進行排序,用x進行描述膀斋,k代表次序,然后計算其標(biāo)準(zhǔn)化的數(shù)據(jù)痹雅,標(biāo)準(zhǔn)化公式為:

【x^{prime}=rac{x-mu}{sigma}】

接著算出每個數(shù)據(jù)的頻次仰担,并記錄好累積頻次,然后計算

【F_{n}left(x_{(k)} ight)】绩社,

(N為累積頻次)摔蓝,n為樣本量即例子中的53。
【F_{0}left(x_{(k)} ight)】為給定的累計分布可以利用excel自行算出愉耙,函數(shù)為:‘=NORM.DIST(x贮尉,mean,sd朴沿,TRUE) mean和sd就為mu和sigma猜谚。進而可以求出
;各個步驟的計算如下:

所以可以算出D為0.218赌渣,D大于0.187魏铅,所以拒絕原假設(shè),接受備擇假設(shè)所以不滿足锡垄。

同時可以使用SPSSAU進行檢驗更為方便沦零,數(shù)據(jù)格式如下:

將數(shù)據(jù)上傳到SPSSAU進行分析,操作如下:

分析結(jié)果如下:

從上述結(jié)果得到货岭,樣本量大于50路操,所以選擇K-S檢驗,發(fā)現(xiàn)統(tǒng)計量D為0.218(和計算的一樣)千贯,p值小于0.05屯仗,所以模型顯著,拒絕原假設(shè)搔谴,數(shù)據(jù)不服從正態(tài)分布魁袜。

同時SPSSAU還提供了JB檢驗:

Jarque-Bera檢驗中,p值小于0.05,所以模型顯著峰弹,拒絕原假設(shè)店量,數(shù)據(jù)不服從正態(tài)分布(針對SPSSAU提供統(tǒng)計量為卡方值的原因:有證明顯示在正態(tài)性假定下,JB統(tǒng)計量漸近地服從自由度為2的卡方分布)鞠呈。


1.3 圖示法

直方圖

直方圖若呈現(xiàn)‘中間高融师,兩邊低,左右基本對稱的鐘形圖’則基本服從正態(tài)分析蚁吝,但是數(shù)據(jù)量過少等也可能影響結(jié)果導(dǎo)致很難呈現(xiàn)出標(biāo)準(zhǔn)的正態(tài)分布旱爆,如果是這種情況如果看見‘鐘形’也可以可以接受的。上圖可以看出窘茁,數(shù)據(jù)呈現(xiàn)的分布并不對稱怀伦,但是也出現(xiàn)近似‘鐘形’曲線,所以也可以勉強接受山林。


P-P圖

P-P圖是將觀察累積概率作為X軸房待,將正態(tài)累積概率作為Y軸,作散點圖驼抹,反映實際累積概率與理論累積概率的符合程度吴攒。如果散點分布近似‘對角線’則可以認為正態(tài)分布,從圖中可以看出數(shù)據(jù)散點分布不是很滿足要求砂蔽,但是也近似為‘對角線’所以勉強接受。


Q-Q圖


Q-Q圖和P-P圖功能一致署惯,分析上大致沒有區(qū)別左驾。


二、如何進行正態(tài)性檢驗

SPSSAU分析位置

(1)通用方法板塊

SPSSAU【通用方法】→描述/ SPSSAU【通用方法】→正態(tài)性檢驗极谊;

(2)可視化板塊

SPSSAU【可視化】→直方圖/ SPSSAU【可視化】→p-p/q-q圖诡右;


三、其它學(xué)習(xí)資料

正態(tài)性檢驗視頻學(xué)習(xí)資料:https://www.bilibili.com/video/av69017119/

直方圖分析方法視須解瀆:https://www.bilibili.com/video/av69465913/

P-P/Q-Q圖分析方法視頻解讀:https://www.bilibili.com/video/av69468707/


四轻猖、非正態(tài)數(shù)據(jù)怎么辦

針對上述幾種方法帆吻,正態(tài)性檢驗最為嚴謹,但是實際數(shù)據(jù)由于樣本量較少等原因咙边,即使數(shù)據(jù)總體正態(tài)但統(tǒng)計檢驗出來也顯示非正態(tài)猜煮,實用性沒有圖示法直觀且接受性沒有圖示法高,所以在分析中常常圖示法應(yīng)用的比較多败许,如果在分析中數(shù)據(jù)嚴重不正態(tài)應(yīng)該怎么辦呢王带?接下來進行說明。

(1)將數(shù)據(jù)取對數(shù)處理

注意:原數(shù)據(jù)需要數(shù)據(jù)大于0市殷,如果不滿足也可以取lg(x+k)等愕撰。

(2)開根號

(3)取倒數(shù)

當(dāng)數(shù)據(jù)波動較大時可以優(yōu)先考慮

(4)Johnson轉(zhuǎn)換

(5)?計量經(jīng)濟學(xué)中常用的BOX-COX變換

(6)移除可能異常值

通常情況下,數(shù)據(jù)經(jīng)過處理會變得相對“正態(tài)”一些;此步可使用SPSSAU的“生成變量”功能即可完成搞挣。



或者嚴重不符合正態(tài)分布無法進行分析也可以使用其他分析方法带迟,比如非參數(shù)檢驗等。


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末囱桨,一起剝皮案震驚了整個濱河市仓犬,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌蝇摸,老刑警劉巖婶肩,帶你破解...
    沈念sama閱讀 207,248評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異貌夕,居然都是意外死亡律歼,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,681評論 2 381
  • 文/潘曉璐 我一進店門啡专,熙熙樓的掌柜王于貴愁眉苦臉地迎上來险毁,“玉大人,你說我怎么就攤上這事们童∨峡觯” “怎么了?”我有些...
    開封第一講書人閱讀 153,443評論 0 344
  • 文/不壞的土叔 我叫張陵慧库,是天一觀的道長跷跪。 經(jīng)常有香客問我,道長齐板,這世上最難降的妖魔是什么吵瞻? 我笑而不...
    開封第一講書人閱讀 55,475評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮甘磨,結(jié)果婚禮上橡羞,老公的妹妹穿的比我還像新娘。我一直安慰自己济舆,他們只是感情好卿泽,可當(dāng)我...
    茶點故事閱讀 64,458評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著滋觉,像睡著了一般签夭。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上椎瘟,一...
    開封第一講書人閱讀 49,185評論 1 284
  • 那天覆致,我揣著相機與錄音,去河邊找鬼肺蔚。 笑死煌妈,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播璧诵,決...
    沈念sama閱讀 38,451評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼汰蜘,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了之宿?” 一聲冷哼從身側(cè)響起族操,我...
    開封第一講書人閱讀 37,112評論 0 261
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎比被,沒想到半個月后色难,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,609評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡等缀,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,083評論 2 325
  • 正文 我和宋清朗相戀三年枷莉,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片尺迂。...
    茶點故事閱讀 38,163評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡笤妙,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出噪裕,到底是詐尸還是另有隱情蹲盘,我是刑警寧澤,帶...
    沈念sama閱讀 33,803評論 4 323
  • 正文 年R本政府宣布膳音,位于F島的核電站召衔,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏祭陷。R本人自食惡果不足惜薄嫡,卻給世界環(huán)境...
    茶點故事閱讀 39,357評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望颗胡。 院中可真熱鬧,春花似錦吩坝、人聲如沸毒姨。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,357評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽弧呐。三九已至,卻和暖如春嵌纲,著一層夾襖步出監(jiān)牢的瞬間俘枫,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,590評論 1 261
  • 我被黑心中介騙來泰國打工逮走, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留鸠蚪,地道東北人。 一個月前我還...
    沈念sama閱讀 45,636評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像茅信,于是被迫代替她去往敵國和親盾舌。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,925評論 2 344

推薦閱讀更多精彩內(nèi)容