箱形圖五要素
(1)中位數(shù)
中位數(shù)晾虑,即二分之一分位數(shù)。所以計算的方法就是將一組數(shù)據(jù)(此處中位數(shù),特別指是從大到小排列的有序序列)按從小到大的順序帜篇,取中間這個數(shù)。
如果原始序列長度n是奇數(shù),那么中位數(shù)所在位置是(n+1)/2抒寂;
如果原始序列長度n是偶數(shù)隔心,那么中位數(shù)所在位置是n/2,n/2+1竟痰,中位數(shù)的值等于這兩個位置的數(shù)的算數(shù)平均數(shù)签钩。
2)上四分位數(shù)Q1?
確定四分位數(shù)的位置。Qi所在位置=i(n+1)/4坏快,其中i=1铅檩,2,3莽鸿。n表示序列中包含的項數(shù)昧旨。
舉個例子,有有序序列一個test = c(1,2,3,4,5,6,7,8)富拗,通過summary(test)來獲取test這個序列的中位數(shù)臼予,上四分位數(shù),下四分位數(shù)以及算數(shù)平均值啃沪。
這個Q1=2.75是怎么計算出來的呢粘拾?首先序列長度n=8,(1+n)/4=2.25创千,這是什么意思呢缰雇?說明上四分位數(shù)在第2.25個位置數(shù),實際上這個數(shù)是不存在的追驴,但我們知道這個位置是在第2個數(shù)與第3個數(shù)之間的械哟。
(3)下四分位數(shù)Q3
這個下四分位數(shù)所在位置計算方法同上,只不過是(1+n)/4*3=6.75殿雪,這個是個介于第六個位置與第七個位置之間的地方暇咆。對應的具體的值是0.75*6+0.25*7=6.25。
4丙曙、上限
上限是非異常范圍內(nèi)的最大值爸业。
首先要知道什么是四分位距如何計算的?
四分位距IQR=Q3-Q1亏镰,那么上限=Q3+1.5IQR
5扯旷、下限
下限是非異常范圍內(nèi)的最小值。
下限=Q1-1.5IQR
目前我們文章中看到的這兩個T形的盒須就是內(nèi)限索抓。上面的T形線段所延伸到的極遠處钧忽,是Q3+1.5IQR(其中毯炮,IQR=Q3-Q1)與剔除異常值后的極大值兩者取最小,下面的T形線段所延伸到的極遠處耸黑,是Q1-1.5IQR與剔除異常值后的極小值兩者取最大桃煎。
外限與內(nèi)限的計算方法相同,唯一的區(qū)別就在與:上面的T形線段所延伸到的極遠處崎坊,是Q3+3IQR(其中备禀,IQR=Q3-Q1)與剔除異常值后的極大值兩者取最小,下面的T形線段所延伸到的極遠處奈揍,是Q1-3IQR與剔除異常值后的極小值兩者取最大曲尸。