1. 四分位數(shù)
1.1 簡述
? ??????四分位數(shù)(Quartile)也稱四分位點(diǎn)驰吓,是指在統(tǒng)計(jì)學(xué)中把所有數(shù)值由小到大排列并分成四等份,處于三個(gè)分割點(diǎn)位置的數(shù)值粒褒。多應(yīng)用于統(tǒng)計(jì)學(xué)中的箱線圖繪制,剔除異常值。四分位數(shù)有三個(gè)纽竣,第一個(gè)四分位數(shù)就是通常所說的四分位數(shù),稱為下四分位數(shù),第二個(gè)四分位數(shù)就是中位數(shù)蜓氨,第三個(gè)四分位數(shù)稱為上四分位數(shù)聋袋,分別用Q1、Q2穴吹、Q3表示:
? ??Q1:第一四分位數(shù)幽勒、“較小四分位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第25%的數(shù)字港令。
? ? Q2:第二四分位數(shù)啥容、又稱“中位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第50%的數(shù)字顷霹。
? ? Q3:第三四分位數(shù)咪惠、又稱“較大四分位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第75%的數(shù)字泼返。
? ? IQR: ?又稱四分位距,IQR = Q3 - Q1
1.1 確定四分位數(shù)
? ??Q1的位置= (n+1) × 0.25
? ??Q2的位置= (n+1) × 0.5
? ??Q3的位置= (n+1) × 0.75
?(n 表示樣本數(shù)量)
? ? example :
? ? ? ? n 為奇數(shù)
? ? ? ? 樣本數(shù)據(jù):6,10徽缚,12凿试,15那婉, 17详炬,19呛谜,22隐岛,25聚凹,29妒牙,44 单旁,66
? ? ? ? 數(shù)據(jù)索引:1、 2愉豺、 ?3蚪拦、 ?4驰贷、 ? 5、 ?6锹锰、 7、 ?8痢士、 ?9良瞧、 ?10褥蚯、 ?11 (即可表示為第 1 個(gè)數(shù)據(jù)為 6赞庶,第 2 個(gè)數(shù)據(jù)為 10)
? ? ? ? Q1 的位置 ?:(11 + 1)?× 0.25 = 3.0 ? ?即 Q1 = 12
? ??????Q2 的位置 ?:(11?+ 1)?× 0.5 ?= ?6.0????即 Q2 = 19
? ??????Q3 的位置 ?:(11?+ 1)?× 0.75 = 9.0????即 Q3 = 29
? ????????n 為偶數(shù)
? ? ? ? 樣本數(shù)據(jù): ? 7, ?15, ?36, ?39, ?40, ?41
? ? ? ? 數(shù)據(jù)索引:1澜薄、 2肤京、 3忘分、 4妒峦、 ?5肯骇、 6
????????Q1的位置:(6 + 1) ?× 0.25 = 1.75?在第一與第二個(gè)數(shù)字之間,?Q1 = 0.75*15+0.25*7 = 13若债,
? ? ? ? Q2的位置: ?(6 + 1)??× 0.5 = 3.5?在第三與第四個(gè)數(shù)字之間,Q2 = (36+39)/2= 37.5傲须,
????????Q3的位置:(6 + 1)??× 0.75 = 5.25?在第五與第六個(gè)數(shù)字之間泰讽,?Q3 = 0.25*41+0.75*40 = 40.25.
1.1 應(yīng)用
? ? ? ? ? A.四分位數(shù)在統(tǒng)計(jì)學(xué)中的箱線圖繪制方面應(yīng)用也很廣泛。所謂箱線圖就是 由一組數(shù)據(jù)5 個(gè)特征繪制的一個(gè)箱子和兩條線段的圖形,這種直觀的箱線圖不僅能反映出一組數(shù)據(jù)的分布特征奥吩,而且還可以進(jìn)行多組數(shù)據(jù)的分析比較霞赫。這五個(gè)特征值甘改,即數(shù)據(jù)的最大值楼誓、最小值、中位數(shù)和兩個(gè)四分位數(shù)榄融。? ??
? ? ? ? B. IQR (四分位差)
? ? ? ? ? ? IQR = Q3 - Q1??
? ? ? ? ? ? IQR 的不足:無法考慮所有的數(shù)據(jù)力九、完全不同的兩個(gè)數(shù)據(jù)集也可以有相同的IQR,例如正太分布、均勻分布、雙峰分布。
? ? ? ?C. 定義異常值
? ? ? ? ? ? 統(tǒng)計(jì)學(xué)中判斷異常值的方式:
? ? ? ? ? ? 異常值被定義為不在?Q1 - 1.5(IQR) ?~ ?Q1 + 1.5(IQR) 范圍內(nèi)的數(shù)據(jù)掏缎。
? ? ? ? ? ? ?outlier < Q1 - 1.5(IQR)
? ? ? ? ? ? ? ? ? ? ? ? ?> Q1 + 1.5(IQR)?