basic data analysis

screening the dataset

兩個目的:1遺失的數(shù)據(jù) check for missing data

2 奇怪的 和 錯誤的數(shù)據(jù)?

什么算是奇怪的數(shù)據(jù)英古?

consistency check 前后回答不一致的

filler questions 是草丧??

極端的數(shù)據(jù) 怎么算極端拟赊??

如何做?

1 analyze frequencies 頻率鸣哀,- check missing data and extreme data 搔体?

2 scatter plot 分布圖 - check consistency

*不會 spss- scatter plot , select cases

對’壞數(shù)據(jù)‘做什么靡狞?

啥都不做

收集更多數(shù)據(jù)

assign missing value-

for not key variables, 填充平均數(shù) substitute neutral values, usually the mean

impute values (根據(jù)附近的數(shù)值填充)

刪掉

決定主要是取決于how many good repondents there are


analyzing dataset

levels of measurement?

assigning number ,spss-values

spss中的scale是指 metric data,包括interval和ratio拘央。

nominal 類別

ordinal 排序

interval 評分什么的 1—10?

ratio 有含義的數(shù)據(jù)

數(shù)據(jù)檢驗statistical tests 就取決于 度量的類型 the level of measurement of a variable

types of statistical analyses

1描述分析descriptive analysis涂屁。總結(jié)樣本灰伟,頻率分析

2推斷 inferential analysis拆又,由樣本推總體儒旬,假設(shè)檢驗 和 confidence intervals(可能存在一個模型啥的) ,one-sample

3比較分析 differences analysis , 比較兩組或多組數(shù)據(jù)mean帖族。differences among means.?

4關(guān)聯(lián)分析 associative analysis,考察一個關(guān)系的strength and direction. cross-tabulations and correlations.

5預(yù)測 predictive analysis: regressions.

descriptive analysis

summarize data 總結(jié)樣本

HOW 如何總結(jié)栈源,(總結(jié)啥)? (一般來說 這些數(shù)據(jù)有意義嗎)

-descriptive analysis 那一套?

1. location: mode , median ,mean

2.variability: (interquartile)range, variance , standard deviation (為啥有了方差還要標(biāo)準(zhǔn)差)竖般,coefficient of variation: =standard deviation/mean?

3.shape : skewness, kurtosis?

*注意:描述分析的意義depending on the level of measurement?

adjusting data?

re-specifying variables 啥意思??

transforming scales -standardizing z-scores

weighing cases/ respondent (不經(jīng)常用)啥意思甚垦? to account for representativeness.

hypothesis testing

1.two-sided tests (等于or不等)

Ho: 變量的參數(shù)是等于某值 the parameter (mean, proportion )of the variable is equal?

H1:the parameter of the variable is different

2.one-sided tests (大于小于)

Ho: 大于等于 or 小于等于

H1:< or >

結(jié)果可以有兩種,一種是test statistic 另一種是p-value.(test statistic 越大涣雕,p-value就越小艰亮,Ho的可能性就越小) 見圖?

所以,test statistic >critical value 就拒絕

p-value <0.05 拒絕?

spss中挣郭,p-value 顯示為“Sig.”

p≤0.05迄埃,Ho is rejected → the parameter is significantly different from xx.

0.05<p≤0.1,Ho is rejected but marginally → the parameter is marginally significantly different from xx.

p >0.1, Ho is not rejected → the parameter is not statistically different from xx.

test statistic?

test statistic > critical value, Ho is rejected?

diagram 'when to use which test?'

圖~

怎么用這張表丈屹??-3 questions:

1. what is the dependent variable?

2.what is the measurement level of the dependent variable??

3.what and how many samples does the hypothesis involve??

-one sample: 比較給定組的參數(shù) (和某一值~)

-independent samples:比較兩個組的參數(shù)调俘。eg. man/woman, branded/unbranded

-related samples: compare the responses of the same individual amongst each other. 其實是同一個樣本 對不同問題的回答 醬紫?

inferential analysis: one-sample tests. representativeness

推斷是否具有代表性旺垒,和給定的某一值比較

Ho:mean in the population where the sample came from =2.28

首先彩库,DV=household size ,DV measurement= ratio ?sample: one sample (必要步驟)

所以(查看表格),用one sample t-test?

eg2:檢驗 房屋分布的比例是否和統(tǒng)計數(shù)據(jù)一致

首先先蒋,DV=sample household proportion, DV measurement= ordinal, sample =one sample?

所以用one sample Kolmogorov- smirnov (by hand or excel )

total population 中的cumulative percentage 和樣本observed cumulative% 計算absolute difference?

test statistic = 最大的那個difference → K=xx

critical value at 5%=1.36 除以 根號下樣本個數(shù) =aa

K 大于 aa →Ho is rejected 顯著不同

檢驗二分法中的比例 the proportion of a dichotomous variable (yes/no)

用Z-test (by hand)

differential analysis:two and more independent or related samples

表格的運用骇钦,見onenote

associative analysis: correlations

變量間的關(guān)系

when there are 2 variables?

both are metric(interval /ratio ), linear relationship , use pearson correlation coefficient?

one or both are ordinal, use spearman rank correlation coefficient?

r 屬于[-1,1]

significant vs. substantive results.

significant 取決于1 “不同”或“相關(guān)”的strength、magnitude竞漾? 以及 2樣本大小 sample size

sig是第一步眯搭,relevance是一個主觀判斷

sig difference or correlation 不能推斷出substantive or relevant?

magnitude of the difference =% change in the response of one group from that of the comparision group?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市业岁,隨后出現(xiàn)的幾起案子鳞仙,更是在濱河造成了極大的恐慌,老刑警劉巖笔时,帶你破解...
    沈念sama閱讀 216,402評論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件棍好,死亡現(xiàn)場離奇詭異,居然都是意外死亡允耿,警方通過查閱死者的電腦和手機借笙,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來较锡,“玉大人业稼,你說我怎么就攤上這事÷煸蹋” “怎么了低散?”我有些...
    開封第一講書人閱讀 162,483評論 0 353
  • 文/不壞的土叔 我叫張陵俯邓,是天一觀的道長。 經(jīng)常有香客問我谦纱,道長看成,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,165評論 1 292
  • 正文 為了忘掉前任跨嘉,我火速辦了婚禮川慌,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘祠乃。我一直安慰自己梦重,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,176評論 6 388
  • 文/花漫 我一把揭開白布亮瓷。 她就那樣靜靜地躺著琴拧,像睡著了一般。 火紅的嫁衣襯著肌膚如雪嘱支。 梳的紋絲不亂的頭發(fā)上蚓胸,一...
    開封第一講書人閱讀 51,146評論 1 297
  • 那天,我揣著相機與錄音除师,去河邊找鬼沛膳。 笑死,一個胖子當(dāng)著我的面吹牛汛聚,可吹牛的內(nèi)容都是我干的锹安。 我是一名探鬼主播,決...
    沈念sama閱讀 40,032評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼倚舀,長吁一口氣:“原來是場噩夢啊……” “哼叹哭!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起痕貌,我...
    開封第一講書人閱讀 38,896評論 0 274
  • 序言:老撾萬榮一對情侶失蹤风罩,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后舵稠,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體泊交,經(jīng)...
    沈念sama閱讀 45,311評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,536評論 2 332
  • 正文 我和宋清朗相戀三年柱查,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片云石。...
    茶點故事閱讀 39,696評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡唉工,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出汹忠,到底是詐尸還是另有隱情淋硝,我是刑警寧澤雹熬,帶...
    沈念sama閱讀 35,413評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站谣膳,受9級特大地震影響竿报,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜继谚,卻給世界環(huán)境...
    茶點故事閱讀 41,008評論 3 325
  • 文/蒙蒙 一烈菌、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧花履,春花似錦芽世、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至妹卿,卻和暖如春旺矾,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背夺克。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評論 1 269
  • 我被黑心中介騙來泰國打工箕宙, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人懊直。 一個月前我還...
    沈念sama閱讀 47,698評論 2 368
  • 正文 我出身青樓扒吁,卻偏偏與公主長得像,于是被迫代替她去往敵國和親室囊。 傳聞我的和親對象是個殘疾皇子雕崩,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,592評論 2 353

推薦閱讀更多精彩內(nèi)容