第一節(jié) 分布 統(tǒng)計(jì)表 統(tǒng)計(jì)圖
一、分布
分布(頻次分布)概念:一個(gè)概念或變量,它的各個(gè)情況出現(xiàn)的次數(shù)或頻次。
變量取值要注意的問題:完備苛秕、互斥
多選題怎樣滿足互斥?
多選項(xiàng)二分法(對(duì)每一個(gè)選項(xiàng)都判斷是否選中)
多選項(xiàng)分類法(挑選有限的幾個(gè)——計(jì)算頻次)
加權(quán)平均法(被調(diào)查者對(duì)選項(xiàng)排序找默,打分)
統(tǒng)計(jì)圖和統(tǒng)計(jì)表都是為了表達(dá)變量的分布的【分布】
二艇劫、統(tǒng)計(jì)表
統(tǒng)計(jì)表概念:用表格形式來表示變量的分布
注意:百分比統(tǒng)計(jì)表要注明統(tǒng)計(jì)總數(shù)
對(duì)于定距變量:要區(qū)分它是連續(xù)型還是離散型
離散型:與定序變量的制表方法相同——變量按照取值的大小排列
連續(xù)型:由于一一列舉會(huì)分類多并且每一類的頻次少,所以采用組距式統(tǒng)計(jì)表
分組要注意的問題惩激?
組數(shù):組數(shù)太多會(huì)增加偶然因素(p30)
等距分組域非等距分組
低收入的月薪差一千生活水平會(huì)差很多店煞,高收入的月薪差一千,生活水平不會(huì)差很多风钻,所以低收入組距小一些
分組的精度(將標(biāo)明組界轉(zhuǎn)化為真實(shí)組界顷蟀,+-0.5)
三、統(tǒng)計(jì)圖
比統(tǒng)計(jì)表直觀
不及統(tǒng)計(jì)表精確
圓瓣圖****************************定類************************************
表示變量取值在總體中占的比例
無法體現(xiàn)出變量取值的排列
條形圖**************************定類骡技、定序********************************
用長條的高度來表示資料類別的頻次或百分比【高度】
長條的寬度沒有意義鸣个,畫成等寬
對(duì)于定類變量,條形是離散的布朦;對(duì)于定序變量囤萤,條形可以是離散的,也可以是緊挨著的
直方圖****************************定距*************************************
直方圖是由緊挨著的長條組成的
直方圖的寬度是有意義的
長條的面積表示頻次或相對(duì)頻次【面積】
長條的高度為頻次密度或相對(duì)頻次密度
這是因?yàn)檫B續(xù)型定距變量可采用非等距分組【非等距分組】
例子:26-27歲結(jié)婚的頻次密度比40-50歲結(jié)婚的頻次密度大(通過條形高度可以直觀看出)
折線圖*****************************定距************************************
用直線連接直方圖中條形頂端的中點(diǎn)即可得到
離散型用離散的那個(gè)值就可以了是趴;連續(xù)型應(yīng)該用組中心值
四涛舍、累計(jì)圖和累計(jì)表
了解小于某一變量值或大于某一變量值總共的頻次是多少
比較個(gè)體在總體中的位置
例子:考80分,超過了95%的人還是50%的人
五唆途、分布圖分析
峰點(diǎn)研究
雙峰的話富雅,說明數(shù)據(jù)的實(shí)體不屬于同一類型
幼兒園既有阿姨掸驱,又有幼兒,比較身高是沒有意義的
對(duì)稱研究
正態(tài)分布:單峰没佑、對(duì)稱
左偏態(tài)(負(fù)向偏態(tài))——左邊尾巴拖得比較長
右偏態(tài)(正向偏態(tài))——右邊尾巴拖得比較長
除此之外毕贼,還有U形曲線和J形曲線
U:人口死亡率和年齡 J:婚姻次數(shù)與人數(shù)