第一節(jié) 分布 統(tǒng)計(jì)表 統(tǒng)計(jì)圖
一、分布
分布(頻次分布)概念:一個(gè)概念或變量深浮,它的各個(gè)情況出現(xiàn)的次數(shù)或頻次。
變量取值要注意的問(wèn)題:完備飞苇、互斥
多選題怎樣滿足互斥?
多選項(xiàng)二分法(對(duì)每一個(gè)選項(xiàng)都判斷是否選中)
多選項(xiàng)分類法(挑選有限的幾個(gè)——計(jì)算頻次)
加權(quán)平均法(被調(diào)查者對(duì)選項(xiàng)排序玄柠,打分)
統(tǒng)計(jì)圖和統(tǒng)計(jì)表都是為了表達(dá)變量的分布的【分布】
二、統(tǒng)計(jì)表
統(tǒng)計(jì)表概念:用表格形式來(lái)表示變量的分布
注意:百分比統(tǒng)計(jì)表要注明統(tǒng)計(jì)總數(shù)
對(duì)于定距變量:要區(qū)分它是連續(xù)型還是離散型
離散型:與定序變量的制表方法相同——變量按照取值的大小排列
連續(xù)型:由于一一列舉會(huì)分類多并且每一類的頻次少羽利,所以采用組距式統(tǒng)計(jì)表
分組要注意的問(wèn)題?
組數(shù):組數(shù)太多會(huì)增加偶然因素(p30)
等距分組域非等距分組
低收入的月薪差一千生活水平會(huì)差很多这弧,高收入的月薪差一千,生活水平不會(huì)差很多虚汛,所以低收入組距小一些
分組的精度(將標(biāo)明組界轉(zhuǎn)化為真實(shí)組界,+-0.5)
三卷哩、統(tǒng)計(jì)圖
比統(tǒng)計(jì)表直觀
不及統(tǒng)計(jì)表精確
圓瓣圖****************************定類************************************
表示變量取值在總體中占的比例
無(wú)法體現(xiàn)出變量取值的排列
條形圖**************************定類、定序********************************
用長(zhǎng)條的高度來(lái)表示資料類別的頻次或百分比【高度】
長(zhǎng)條的寬度沒有意義将谊,畫成等寬
對(duì)于定類變量,條形是離散的尊浓;對(duì)于定序變量,條形可以是離散的栋齿,也可以是緊挨著的
直方圖****************************定距*************************************
直方圖是由緊挨著的長(zhǎng)條組成的
直方圖的寬度是有意義的
長(zhǎng)條的面積表示頻次或相對(duì)頻次【面積】
長(zhǎng)條的高度為頻次密度或相對(duì)頻次密度
這是因?yàn)檫B續(xù)型定距變量可采用非等距分組【非等距分組】
例子:26-27歲結(jié)婚的頻次密度比40-50歲結(jié)婚的頻次密度大(通過(guò)條形高度可以直觀看出)
折線圖*****************************定距************************************
用直線連接直方圖中條形頂端的中點(diǎn)即可得到
離散型用離散的那個(gè)值就可以了襟诸;連續(xù)型應(yīng)該用組中心值
四基协、累計(jì)圖和累計(jì)表
了解小于某一變量值或大于某一變量值總共的頻次是多少
比較個(gè)體在總體中的位置
例子:考80分歌亲,超過(guò)了95%的人還是50%的人
五堡掏、分布圖分析
峰點(diǎn)研究
雙峰的話应结,說(shuō)明數(shù)據(jù)的實(shí)體不屬于同一類型
幼兒園既有阿姨泉唁,又有幼兒揩慕,比較身高是沒有意義的
對(duì)稱研究
正態(tài)分布:?jiǎn)畏逋ば蟆?duì)稱
左偏態(tài)(負(fù)向偏態(tài))——左邊尾巴拖得比較長(zhǎng)
右偏態(tài)(正向偏態(tài))——右邊尾巴拖得比較長(zhǎng)
除此之外迎卤,還有U形曲線和J形曲線
U:人口死亡率和年齡 J:婚姻次數(shù)與人數(shù)