第一節(jié) 分布 統(tǒng)計表 統(tǒng)計圖
一、分布
分布(頻次分布)概念:一個概念或變量糙箍,它的各個情況出現(xiàn)的次數(shù)或頻次讲仰。
變量取值要注意的問題:完備、互斥
多選題怎樣滿足互斥漾峡?
多選項二分法(對每一個選項都判斷是否選中)
多選項分類法(挑選有限的幾個——計算頻次)
加權平均法(被調(diào)查者對選項排序攻旦,打分)
統(tǒng)計圖和統(tǒng)計表都是為了表達變量的分布的【分布】
二、統(tǒng)計表
統(tǒng)計表概念:用表格形式來表示變量的分布
注意:百分比統(tǒng)計表要注明統(tǒng)計總數(shù)
對于定距變量:要區(qū)分它是連續(xù)型還是離散型
離散型:與定序變量的制表方法相同——變量按照取值的大小排列
連續(xù)型:由于一一列舉會分類多并且每一類的頻次少生逸,所以采用組距式統(tǒng)計表
分組要注意的問題牢屋?
組數(shù):組數(shù)太多會增加偶然因素(p30)
等距分組域非等距分組
低收入的月薪差一千生活水平會差很多且预,高收入的月薪差一千,生活水平不會差很多烙无,所以低收入組距小一些
分組的精度(將標明組界轉(zhuǎn)化為真實組界锋谐,+-0.5)
三、統(tǒng)計圖
比統(tǒng)計表直觀
不及統(tǒng)計表精確
圓瓣圖****************************定類************************************
表示變量取值在總體中占的比例
無法體現(xiàn)出變量取值的排列
條形圖**************************定類截酷、定序********************************
用長條的高度來表示資料類別的頻次或百分比【高度】
長條的寬度沒有意義涮拗,畫成等寬
對于定類變量,條形是離散的迂苛;對于定序變量三热,條形可以是離散的,也可以是緊挨著的
直方圖****************************定距*************************************
直方圖是由緊挨著的長條組成的
直方圖的寬度是有意義的
長條的面積表示頻次或相對頻次【面積】
長條的高度為頻次密度或相對頻次密度
這是因為連續(xù)型定距變量可采用非等距分組【非等距分組】
例子:26-27歲結(jié)婚的頻次密度比40-50歲結(jié)婚的頻次密度大(通過條形高度可以直觀看出)
折線圖*****************************定距************************************
用直線連接直方圖中條形頂端的中點即可得到
離散型用離散的那個值就可以了三幻;連續(xù)型應該用組中心值
四就漾、累計圖和累計表
了解小于某一變量值或大于某一變量值總共的頻次是多少
比較個體在總體中的位置
例子:考80分,超過了95%的人還是50%的人
五赌髓、分布圖分析
峰點研究
雙峰的話从藤,說明數(shù)據(jù)的實體不屬于同一類型
幼兒園既有阿姨,又有幼兒锁蠕,比較身高是沒有意義的
對稱研究
正態(tài)分布:單峰夷野、對稱
左偏態(tài)(負向偏態(tài))——左邊尾巴拖得比較長
右偏態(tài)(正向偏態(tài))——右邊尾巴拖得比較長
除此之外,還有U形曲線和J形曲線
U:人口死亡率和年齡 J:婚姻次數(shù)與人數(shù)