3. 數(shù)據(jù)的概括性度量

數(shù)據(jù)的分布特征可以用柱形圖碎捺、折線圖或餅圖等各種圖表直觀地進(jìn)行展現(xiàn)。反映數(shù)據(jù)的分布特征的代表值狰晚,通常用集中趨勢離散程度分布形狀來描述缴啡。

1. 當(dāng)我們在談統(tǒng)計學(xué)時壁晒,提到過數(shù)據(jù)按計量單位分為分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)业栅,針對這三種不同的數(shù)據(jù)類型秒咐,數(shù)據(jù)分布特征的描述也都不相同。


一碘裕、集中趨勢:數(shù)據(jù)向中心值靠攏的程度

1. 分類數(shù)據(jù)——眾數(shù):出現(xiàn)次數(shù)最多的變量值(EXCEL:MODE函數(shù))携取。

2. 順序數(shù)據(jù)——中位數(shù)和分位數(shù):中位數(shù)是指一組數(shù)據(jù)排序后在中間位置的變量值(EXCEL:MEDIAN函數(shù))。四分位數(shù)是指一組數(shù)據(jù)排序后處于25%和75%位置上的值帮孔,其實中位數(shù)就是50%位置上的值(EXCEL:QUARTILE函數(shù))雷滋。

3. 數(shù)值型數(shù)據(jù)——平均數(shù):數(shù)據(jù)相加后除以數(shù)據(jù)的個數(shù)(EXCEL:AVERAGE函數(shù))。

4. 眾數(shù)文兢、中位數(shù)和平均數(shù)的比較

不同分布的眾數(shù)晤斩、中位數(shù)和平均數(shù)

當(dāng)數(shù)據(jù)為偏態(tài)分布時,可以考慮選擇中位數(shù)姆坚,代表性比平均數(shù)好澳泵。舉個例子:

張村有個張千萬,九個鄰居窮光蛋旷偿。

統(tǒng)計平均算一算烹俗,各個都是張百萬爆侣。

問:如果你要去張村做生意,是賣奢侈品還是生活用品幢妄?


二兔仰、離散程度:變量值遠(yuǎn)離中心的程度

1. 分類數(shù)據(jù)——異眾比率:非眾數(shù)組的頻數(shù)的占比。占比越小蕉鸳,眾數(shù)的代表性越好乎赴。

2. 順序數(shù)據(jù)——四分位差:上四分位數(shù)與下四分位數(shù)之差。四分位差越小潮尝,集中程度越高榕吼。

3. 數(shù)值型數(shù)據(jù)——方差和標(biāo)準(zhǔn)差

(1)方差:計算公式如下,標(biāo)準(zhǔn)差為方差的平方根勉失。

方差計算公式

分母n-1稱為自由度羹蚣。自由度是指一組數(shù)據(jù)中可以自由取值的個數(shù),在方差公式中乱凿,首先計算的是X的平均數(shù)顽素,在X的平均數(shù)確認(rèn)后,必然有一個值不能自由取值徒蟆,能自由取值的個數(shù)就是n-1個胁出。

舉個例子,假如有三個數(shù)段审,X平均值為5全蝶,其中有兩個數(shù)分別為6和7,那么第三個數(shù)必然為2寺枉。

(2)相對位置的度量

在處理不同量綱的變量時抑淫,為了消除量綱差異,需要對變量進(jìn)行標(biāo)準(zhǔn)化型凳。


標(biāo)準(zhǔn)分?jǐn)?shù)

標(biāo)準(zhǔn)分?jǐn)?shù)表達(dá)了在一組數(shù)據(jù)中丈冬,各數(shù)值的相對位置。比如Z=-1.5甘畅,也就是比平均數(shù)低1.5個標(biāo)準(zhǔn)差埂蕊。

除此之外,對稱分布時的正態(tài)分布疏唾,任何分布形狀的切比雪夫不等式蓄氧,都對數(shù)據(jù)的分布與均值和標(biāo)準(zhǔn)差的關(guān)系做了很好的解釋,后面涉及到時再做展開槐脏。

(3)離散系數(shù)

平均水平不同的變量喉童,不宜直接比較標(biāo)準(zhǔn)差。離散系數(shù)能消除變量值水平高低和單位不同的影響顿天。

離散系數(shù)(變異系數(shù))= 標(biāo)準(zhǔn)差/平均值

離散系數(shù)越大堂氯,離散程度也越大蔑担。對不同的樣本數(shù)據(jù)進(jìn)行比較時,通常用離散系數(shù)咽白。


三啤握、偏態(tài)與峰態(tài)

偏態(tài)與峰態(tài)分布

1.偏態(tài)SK:對數(shù)據(jù)分布對稱性的測量。(EXCEL:SKEW函數(shù))

SK>0 右偏晶框,SK<0排抬,左偏。SK=0授段,對稱蹲蒲。越接近0 ,偏態(tài)程度越低侵贵。SK越大届搁,偏斜程度越大。

2.峰態(tài)K:數(shù)據(jù)分布平峰或尖峰程度的測量模燥。(EXCEL:KURT函數(shù))

峰態(tài)是與標(biāo)準(zhǔn)正態(tài)分布比較咖祭,服從標(biāo)準(zhǔn)正態(tài)分布,K=0蔫骂。K>0,尖峰分布牺汤,數(shù)據(jù)比較集中辽旋,K<0,平峰分布檐迟,數(shù)據(jù)比較分散补胚。

在EXCEL中,我們可以通過數(shù)據(jù)分析—描述分析追迟,來獲取偏度峰度溶其,以及其他的數(shù)據(jù)概括性度量值。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末敦间,一起剝皮案震驚了整個濱河市瓶逃,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌廓块,老刑警劉巖厢绝,帶你破解...
    沈念sama閱讀 210,914評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異带猴,居然都是意外死亡昔汉,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,935評論 2 383
  • 文/潘曉璐 我一進(jìn)店門拴清,熙熙樓的掌柜王于貴愁眉苦臉地迎上來靶病,“玉大人会通,你說我怎么就攤上這事÷χ埽” “怎么了渴语?”我有些...
    開封第一講書人閱讀 156,531評論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長昆咽。 經(jīng)常有香客問我驾凶,道長,這世上最難降的妖魔是什么掷酗? 我笑而不...
    開封第一講書人閱讀 56,309評論 1 282
  • 正文 為了忘掉前任调违,我火速辦了婚禮,結(jié)果婚禮上泻轰,老公的妹妹穿的比我還像新娘技肩。我一直安慰自己,他們只是感情好浮声,可當(dāng)我...
    茶點故事閱讀 65,381評論 5 384
  • 文/花漫 我一把揭開白布虚婿。 她就那樣靜靜地躺著,像睡著了一般泳挥。 火紅的嫁衣襯著肌膚如雪然痊。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,730評論 1 289
  • 那天屉符,我揣著相機(jī)與錄音剧浸,去河邊找鬼。 笑死矗钟,一個胖子當(dāng)著我的面吹牛唆香,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播吨艇,決...
    沈念sama閱讀 38,882評論 3 404
  • 文/蒼蘭香墨 我猛地睜開眼躬它,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了东涡?” 一聲冷哼從身側(cè)響起冯吓,我...
    開封第一講書人閱讀 37,643評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎软啼,沒想到半個月后桑谍,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,095評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡祸挪,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,448評論 2 325
  • 正文 我和宋清朗相戀三年锣披,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,566評論 1 339
  • 序言:一個原本活蹦亂跳的男人離奇死亡雹仿,死狀恐怖增热,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情胧辽,我是刑警寧澤峻仇,帶...
    沈念sama閱讀 34,253評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站邑商,受9級特大地震影響摄咆,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜人断,卻給世界環(huán)境...
    茶點故事閱讀 39,829評論 3 312
  • 文/蒙蒙 一吭从、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧恶迈,春花似錦涩金、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,715評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至奈附,卻和暖如春全度,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背桅狠。 一陣腳步聲響...
    開封第一講書人閱讀 31,945評論 1 264
  • 我被黑心中介騙來泰國打工讼载, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人中跌。 一個月前我還...
    沈念sama閱讀 46,248評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像菇篡,于是被迫代替她去往敵國和親漩符。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,440評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 利用數(shù)據(jù)的圖表展示數(shù)據(jù)驱还,可以對數(shù)據(jù)的分布形狀和特征有一個大致的了解嗜暴。但是要全面的把握數(shù)據(jù)的分布特征,還需要找到反映...
    沒有那么委屈閱讀 2,428評論 0 4
  • 《數(shù)據(jù)分析的統(tǒng)計基礎(chǔ)》的讀書筆記 作 者:經(jīng)管之家议蟆、曹正鳳 出版社:電子工業(yè)出版社 版 次:2015年2月第1...
    格式化_001閱讀 9,501評論 1 58
  • 1. 簡述相關(guān)分析和回歸分析的區(qū)別和聯(lián)系闷沥。 回歸分析和相關(guān)分析都是研究兩個或兩個以上變量之間關(guān)系的方法。 廣義上說...
    安也也閱讀 8,670評論 0 3
  • 數(shù)據(jù)分析方法分為四大類: 1咐容、單純的數(shù)據(jù)加工方法 a.描述性統(tǒng)計分析(集中舆逃、離中趨勢分析和數(shù)據(jù)分布) b.相關(guān)性分...
    重生之魂閱讀 2,800評論 0 3
  • 袁大頭是民國時期主要流通貨幣之一,“袁大頭”是對袁世凱像系列硬幣的口語俗稱,嚴(yán)謹(jǐn)點說叫“袁世凱像背嘉禾銀幣”路狮。辛亥...
    古玩的收藏閱讀 598評論 0 0