《現(xiàn)代心理與教育統(tǒng)計學》 第二章 數(shù)據(jù)和圖表

Remark:對心理學感興趣柠掂,源自自我心理探索,決定學習中科院的兒童發(fā)展與教育心理學锁施,倍感忐忑和壓力陪踩,專業(yè)領(lǐng)域跨度較大,也很久不曾認真學習過某項課程悉抵。既然已經(jīng)開始肩狂,就全力以赴吧。

? 授課老師:禤宇明? ??腦與認知科學國家重點實驗室??中國科學院心理研究所

第二章? 數(shù)據(jù)和圖表

一姥饰、基礎(chǔ)知識

? ? ? – 變量傻谁、尺度、數(shù)據(jù)

二列粪、? 數(shù)據(jù)類型與分析方法

? ? ? – 類別數(shù)據(jù)审磁、順序數(shù)據(jù)、等距數(shù)據(jù)岂座、比例數(shù)據(jù)

三态蒂、 數(shù)據(jù)的來源

四、? 數(shù)據(jù)的整理和統(tǒng)計圖表

? ?? ? ?–?次數(shù)多邊形费什、條形圖钾恢、餅圖、線圖鸳址、直方圖瘩蚪、散點圖

一、 基礎(chǔ)知識

1.1 變量稿黍、尺度疹瘦、數(shù)據(jù)

? 例:身高:高、矮巡球、中等個頭言沐; 180cm

?變量variable:事物的某種特征,這種特征在不同個體之間有差異

尺度(量表)scale:變量的測量標準

數(shù)據(jù)data:測量的結(jié)果

——對同一個研究對象辕漂,用不同的尺度進行測量呢灶,也可以得到不同的結(jié)果(如姚明的官方身高為226cm,這是用米尺測量的結(jié)果钉嘹,換算成英尺就是7 英尺6英寸;如果換成其他尺度測量得出的數(shù)據(jù)也就不同鲸阻;也可以直接說“很高”)

變異varation:?研究對象中各觀察個體之間的差異

例:線性函數(shù)y=ax+b(a和b均為常數(shù))中跋涣,x變化缨睡,y會發(fā)生有規(guī)律的變化,但是在統(tǒng)計中會出現(xiàn)的情況通常是y=ax+b+e陈辱,e也是個變量奖年,而且有可能是不可控的變量,也就是不同觀察個體之間存在細微或不可控的差異沛贪。

1. 2 四種測量尺度

(1)類別尺度(Nominal Scale)陋守,也叫稱名尺度或列名尺度?

例子:—性別(男、女)利赋、企業(yè)性質(zhì)水评、職業(yè)、地區(qū)

? ? ? ? ? ?— 檢驗(陰性媚送、陽性)中燥、血型

特性: — 也叫稱名尺度或列名尺度;

? ? ? ? ? ?— 只能按照事物的某種屬性對其進行平行的分類或分組

? ? ? ? ? ?—? 只能區(qū)分事物是同類或不同類(=或≠)

? ? ? ? ? ? — 通常計算每一類別中各元素或個體出現(xiàn)的額“次數(shù)”或“頻率”來進行分析

例:一個班55名同學塘偎,女生25人疗涉,男生30人。

? ? 在這里吟秩,“性別”是變量咱扣,“男”和“女”是類別數(shù)據(jù),25和30是計數(shù)數(shù)據(jù)涵防。

(2)順序尺度 (Ordinal Scale)

順序數(shù)據(jù)也叫等級(rank )數(shù)據(jù)

例子:—績效評定:優(yōu)闹伪、良、中武学、及格祭往、不及格

? ? ? ? ? — 病情:輕、中火窒、重

特性:— 對事物之間等級差別或順序差別的一種測度

? ? ? ? ? ?— 可以將事物分成不同的類別硼补,還可以確定這些類別的優(yōu)劣或順序

? ? ? ? ? ?— 該尺度具有“>或<”、“=和≠”的數(shù)學特性熏矿,但不可進行加減乘除運算

例:單位的級別有“科級”已骇、“處級”、“副處級”等票编,如果一個人是“科級”褪储,那么他所的“級別”變量的數(shù)據(jù)應(yīng)該是“=科級”,或“<處級”慧域,即“級別=科級”鲤竹,或“級別<處級”。

(3)等距尺度(Interval Scale)

例子:溫度:華氏℉(Fahrenheit)=℃*9/5+32昔榴;各種能力分數(shù)辛藻;智商等

特性: — 測量結(jié)果表現(xiàn)為數(shù)值碘橘,有相等的單位,但沒有絕對零點

? ? ? ? ? ? — 等距尺度具有類別尺度吱肌、順序尺度的數(shù)學特性痘拆,結(jié)果只可加減,不可乘除

(4)比例尺度(Ratio Scale)

例子:— 長度氮墨、重量纺蛆、收入、心率规揪、百分制考試分數(shù)

特性:— 測量結(jié)果表現(xiàn)為數(shù)值桥氏,表明量的大小,有相等的單位粒褒,且有絕對零點

? ? ? ? ? ? — 比例尺度具有類別尺度识颊、順序尺度和等距尺度的數(shù)學特征,結(jié)果可進行乘除運算

等距尺度與比例尺度的區(qū)別在于測量工具是否有絕對零點奕坟。對于溫度而言祥款,華氏和攝氏兩種工具的零點不同,因此屬于等距尺度月杉。長度的測量刃跛,無論是使用英尺、米尺或其他苛萎,零點都是相同的桨昙,因此屬于比例尺度。

思考題1:數(shù)學考試中得了80分腌歉,那么這個80分所對應(yīng)額0分是絕對對的還是相對的呢蛙酪?

? ? ? ? ? ? ? ?—— 是相對零點,因為這個0并非絕對衡量點翘盖。如果試卷很難桂塞,這時候起點0會無形間被拔高,所以應(yīng)該相應(yīng)下調(diào)馍驯,這種情況下80分應(yīng)該高于常規(guī)的80分阁危。反之亦然。(P17—等距數(shù)據(jù)interval data)

二汰瘫、數(shù)據(jù)類型和分析方法

2.1 數(shù)據(jù)的類型

1. 四分法:類別數(shù)據(jù)狂打、順序數(shù)據(jù)、等距數(shù)據(jù)混弥、比例數(shù)據(jù)(P16)

2. 二分法:定性數(shù)據(jù)(Qualitative data):類別數(shù)據(jù)趴乡、順序數(shù)據(jù)

? ? ? ? ? ? ? ? ? 定量數(shù)據(jù)(Quantitative data):等距數(shù)據(jù)、比例數(shù)據(jù)

統(tǒng)計數(shù)據(jù)類型

有個從未管過自己孩子的統(tǒng)計學家,在一個星期六下午妻子要外出買東西時浙宜,勉強 答應(yīng)照看一下四個年幼好動的孩子官辽。當妻子回家時蛹磺,交給妻子一張紙條粟瞬,上面寫著:“擦眼淚11次;系鞋帶15次萤捆;給每個孩子吹玩 具氣球各5次裙品;每個氣球的平均壽命10秒鐘;警告孩子不要橫穿馬路26次俗或;孩子堅持要穿馬路26次市怎;我還要再過這樣的星期六0次⌒廖浚”

不同類型數(shù)據(jù)之間的變換

?? 一般的變化方向:?數(shù)值型?→?等級(順序)類別

?? 偶爾:?順序 → 數(shù)值

2.2 數(shù)據(jù)類型與統(tǒng)計方法

數(shù)據(jù)類型與統(tǒng)計方法

三区匠、統(tǒng)計數(shù)據(jù)的來源

3.1? 直接來源

? — 調(diào)查:普查、抽樣調(diào)查

? — 觀察與實驗

3.2? 間接來源(二手數(shù)據(jù))

— 不是自己親自調(diào)查的帅腌,是別人的數(shù)據(jù)驰弄、公開出版或報道的數(shù)據(jù):統(tǒng)計年鑒;報刊速客、雜志戚篙、圖書、廣播溺职、電視傳媒中的各種數(shù)據(jù)資料

四岔擂、數(shù)據(jù)的整理和統(tǒng)計圖表

4.1? 數(shù)據(jù)整理

1.?數(shù)據(jù)整理的概念:通過各種渠道搜集到統(tǒng)計數(shù)據(jù)之后,首先應(yīng)對其進行加工整理浪耘,使之系統(tǒng)化乱灵、條理化,以符合分析的需要七冲。

整理可以大大簡化數(shù)據(jù)痛倚,更容易理解和分析。

2. 數(shù)據(jù)整理的步驟:數(shù)據(jù)的預(yù)處理——分類或分組——匯總

? (1)數(shù)據(jù)的預(yù)處理

? ? ? ? ??? 數(shù)據(jù)的審核與篩選——檢查每個樣本點是否完整癞埠、準確状原;將不符合要求的數(shù)據(jù)刪除,符合條件的選出來苗踪。

? ? ? ? ??? 數(shù)據(jù)的排序(sort或order)——便于發(fā)現(xiàn)數(shù)據(jù)特征或趨勢颠区,也有助于檢查錯誤

? (2)分類或分組(grouping):根據(jù)研究對象的特征,將所得數(shù)據(jù)劃分到各個組別中通铲。

? ? ? 統(tǒng)計分組應(yīng)注意:① 以研究對象的本質(zhì)特性為基礎(chǔ)毕莱;② 分類標注要明確清晰,能包括所有的數(shù)據(jù)

??(3)?匯總

3. 數(shù)據(jù)整理的原則

? ? ???對定性數(shù)據(jù)主要做分類整理

? ? ???對定量數(shù)據(jù)主要做分組整理

4.2 類別數(shù)據(jù)的整理與圖表展示

? ?1.? 整理

? ? ? ? ?–?? ?列出事物的類別,計算出每一類別的次數(shù)朋截、頻率或比例蛹稍、比率

? ? 2.??圖表展示

? ? ? ? ?–?? ?次數(shù)分布表:?列出不同類別所對應(yīng)的次數(shù)或比例

次數(shù)分布 frequency distribution

次數(shù)分布表

? ? 3.??條形圖bar graph、餅圖pie graph

條形圖對于數(shù)量多少的對比一目了然部服。(這里是網(wǎng)民的受教育程度唆姐,網(wǎng)民并非全體國民,而且當時上網(wǎng)的主要是大學生偏多廓八,因此網(wǎng)民的受教育程度偏高奉芦。)


餅圖(選擇最合適的圖而非最花哨的圖,在最合適的圖中選擇最喜歡的)? ? ? ?





出生人口性別比:是活產(chǎn)男嬰數(shù)與活產(chǎn)女嬰數(shù)的比值剧蹂,通常用女嬰數(shù)量為100時所對應(yīng)的男嬰數(shù)來表示声功。正常情況下,出生性別比是由生物學規(guī)律決定的宠叼,保持在103~107之間先巴。


4.3 順序數(shù)據(jù)的整理與顯示

1. 類別數(shù)據(jù)的整理和顯示的內(nèi)容都適用于順序數(shù)據(jù)。除此之外順序數(shù)據(jù)還可以計算累積次數(shù)冒冬,圖形顯示用到累積次數(shù)分布圖

2. 累積次數(shù)(cumulative frequencies) 將各類別的次數(shù)逐級累加起來

? ? ? – 向上累積:從類別順序開始一方向最后一方累加頻數(shù)

? ? ? – 向下累積:從類別順序最后一方向開始一方累加頻數(shù)

3. 累積百分比(cumulative percentages)

4.4 定量數(shù)據(jù)的整理和圖表顯示

(1)數(shù)據(jù)的分組

? – 定量數(shù)據(jù)包括等距數(shù)據(jù)和比例數(shù)據(jù)伸蚯,在整理時通常要進行分組,然后再計算出各組中出現(xiàn)的次數(shù)窄驹。分組方法一般用組距分組法

(2) 圖表顯示

?– 次數(shù)分布表

?– 直方圖朝卒、次數(shù)多邊形圖、累加直方圖

4.4.1 組距分組的步驟

1. 求全距

? ? ? ?– R=Max-Min

2. 定組數(shù)

? ? ? ?–? 組數(shù)過多過少都不合適

? ? ? – 經(jīng)驗公式 組數(shù) k=1.87(N-1)0.4乐埠, N為數(shù)據(jù)個數(shù)

3. 定組距

? ? – 組距是一個組的上限與下限之差 抗斤;距=(最大值-最小值)/組數(shù)

4. 寫出組限

? ?– 建議用精確組限

5. 求組中值

? ?– 組中值=(精確上限+精確下限)÷2

6. 歸類劃記

7. 登記次數(shù)

4.4.2 定量數(shù)據(jù)的圖表展示

直方圖 histogram

直方圖跟正態(tài)分布圖十分接近,即實際數(shù)據(jù)和理論數(shù)據(jù)差異不大丈咐;矩形的面積大小即表示著數(shù)據(jù)的多少瑞眼;在正態(tài)分布曲線下笼平,那么區(qū)間曲線下的面積即為數(shù)據(jù)的多少意敛。整個曲線下的面積為100%耕驰,即1胞得。找出上方直方圖中每個矩形上面一條邊的中點,然后用直線連接起來奋渔,就形成了次數(shù)多邊形

次數(shù)多邊形 frequency polygon

這是一個離散數(shù)據(jù)的次數(shù)多邊形

關(guān)于上面的frequency polygon张足,有幾個問題:

1.?f和p分別表示什么笨枯?f 表示對應(yīng)分數(shù)出現(xiàn)的具體蛙讥、絕對次數(shù)锯蛀,p 表示比例,即相對次數(shù)次慢;

2. 每一次的總?cè)藬?shù)N1和N2分別是多少旁涤?N=f/p翔曲,因此N1=1/0.01=100,N2=1/0.02=50

3. 縱坐標為什么用 p 而不是 f劈愚?只有用p瞳遍,兩條曲線下的面積才相等,面積都為1菌羽。f1\geq f2掠械,如果用f作為縱坐標,f1 所對應(yīng)的曲線面積一定是大于f2的算凿。

4. 哪一組成績更好份蝴?第二組分數(shù)高:橫坐標是分數(shù),第二組整條曲線整體偏右氓轰。

累加直方圖 cumulative histogram

頻數(shù)分布圖的形態(tài)

三個單峰分布圖

問題:假如上圖表示的是考試成績,那么試題較難的對應(yīng)分布圖是哪個浸卦?

? ? ? ? ? 回答:正偏態(tài)分布署鸡。因為題目較難,高分的人數(shù)會相對較少限嫌。


思考題1:在某小鎮(zhèn)對下面變量進行調(diào)查靴庆,把變量與其直方圖相匹配,并解釋理由

① 父母雙方均小于25歲的家庭中所有成員的身高?

答案:B怒医。涉及父母就會有小孩子炉抒,父母又分男性和女性,因此會出現(xiàn)三個峰值稚叹。成人身高差異相對較小焰薄,數(shù)據(jù)相對集中,而小孩子身高差異會比較大扒袖,數(shù)據(jù)相對分散塞茅,因此小孩身高對應(yīng)的統(tǒng)計曲線會更扁平。

② 已婚夫婦的身高

答案: C季率。夫婦就涉及成年男性和成年女性野瘦,而男性和女性身高會不同,會有兩個峰值飒泻。且成年人的身高相較孩子高鞭光,橫坐標上的起點會更偏右。

③ 全體居民的身高

答案:D泞遗。

④ 所有小汽車car的高度

答案:A惰许。A的峰值為該高度的車輛數(shù)目最多,且車的高度整體而言低于人的身高刹孔,因此可以推斷A是有關(guān)車的統(tǒng)計啡省。一般家用車的高度差別不會太大娜睛,A的最大值與最小值之間差距較小,也比較符合卦睹。



思考題2:1960和1980年畦戒,對美國婦女進行調(diào)查:“你有幾個孩子?”結(jié)果如下所示结序。

– 變量是離散的還是連續(xù)的障斋?答案:離散的。

– 畫直方圖(“9或更多可以”可以取為9)

– 從圖中能得出什么結(jié)論徐鹤?


直方圖:除了兩個孩子的家庭人數(shù)增多垃环,其他孩子數(shù)目的家庭數(shù)目都有所下降,說明人們的生育愿望降低返敬。


2000年全國人口普查結(jié)果

提問:1. 藍色和紅色線分別代表什么性別遂庄?答案:藍色是男生,紅色是女生劲赠。理由:中國整體人口是男多女少涛目;女性壽命長,因此高年齡段女性人數(shù)較多凛澎。

將上面的直方圖逆時針旋轉(zhuǎn)90度霹肝,然后將左邊的圖鏡面到右邊,得到的圖跟下面的第二個圖很像塑煎,即人口負增長:

第一個圖形是人口零增長沫换,第二個圖體現(xiàn)人口負增長,第三個圖體現(xiàn)人口正增長最铁。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
禁止轉(zhuǎn)載讯赏,如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者。
  • 序言:七十年代末炭晒,一起剝皮案震驚了整個濱河市待逞,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌网严,老刑警劉巖识樱,帶你破解...
    沈念sama閱讀 212,383評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異震束,居然都是意外死亡怜庸,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,522評論 3 385
  • 文/潘曉璐 我一進店門垢村,熙熙樓的掌柜王于貴愁眉苦臉地迎上來割疾,“玉大人,你說我怎么就攤上這事嘉栓『觊牛” “怎么了拓诸?”我有些...
    開封第一講書人閱讀 157,852評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長麻昼。 經(jīng)常有香客問我奠支,道長,這世上最難降的妖魔是什么抚芦? 我笑而不...
    開封第一講書人閱讀 56,621評論 1 284
  • 正文 為了忘掉前任倍谜,我火速辦了婚禮,結(jié)果婚禮上叉抡,老公的妹妹穿的比我還像新娘尔崔。我一直安慰自己,他們只是感情好褥民,可當我...
    茶點故事閱讀 65,741評論 6 386
  • 文/花漫 我一把揭開白布季春。 她就那樣靜靜地躺著,像睡著了一般轴捎。 火紅的嫁衣襯著肌膚如雪鹤盒。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,929評論 1 290
  • 那天侦副,我揣著相機與錄音,去河邊找鬼驼鞭。 笑死秦驯,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的挣棕。 我是一名探鬼主播译隘,決...
    沈念sama閱讀 39,076評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼洛心!你這毒婦竟也來了固耘?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,803評論 0 268
  • 序言:老撾萬榮一對情侶失蹤词身,失蹤者是張志新(化名)和其女友劉穎厅目,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體法严,經(jīng)...
    沈念sama閱讀 44,265評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡损敷,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,582評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了深啤。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片拗馒。...
    茶點故事閱讀 38,716評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖溯街,靈堂內(nèi)的尸體忽然破棺而出诱桂,到底是詐尸還是另有隱情洋丐,我是刑警寧澤,帶...
    沈念sama閱讀 34,395評論 4 333
  • 正文 年R本政府宣布挥等,位于F島的核電站友绝,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏触菜。R本人自食惡果不足惜九榔,卻給世界環(huán)境...
    茶點故事閱讀 40,039評論 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望涡相。 院中可真熱鬧哲泊,春花似錦、人聲如沸催蝗。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,798評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽丙号。三九已至先朦,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間犬缨,已是汗流浹背喳魏。 一陣腳步聲響...
    開封第一講書人閱讀 32,027評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留怀薛,地道東北人刺彩。 一個月前我還...
    沈念sama閱讀 46,488評論 2 361
  • 正文 我出身青樓,卻偏偏與公主長得像枝恋,于是被迫代替她去往敵國和親创倔。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,612評論 2 350