統(tǒng)計(jì)測(cè)量任務(wù)八
名詞解釋
1.隨機(jī)模型:研究中自變量(因素)水平(又稱實(shí)驗(yàn)處理)是隨機(jī)取樣催烘,所選各水平僅是無限多個(gè)水平中的一部分有代表性的樣本。
2.固定模型:研究中自變量(因素)總體是有限的幾個(gè)固定值。所選的實(shí)驗(yàn)處理水平即為處理水平的總體谢澈。
3.組間設(shè)計(jì):即每個(gè)(或每組)被試只接受一種自變量水平的實(shí)驗(yàn)處理洒嗤,不同被試接受不同的自變量水平實(shí)驗(yàn)處理。
4.組內(nèi)設(shè)計(jì):指每個(gè)或每組被試接受所有自變量水平的實(shí)驗(yàn)處理的真實(shí)驗(yàn)設(shè)計(jì)蜻展,又稱“重復(fù)測(cè)量設(shè)計(jì)”喉誊。這時(shí),每個(gè)被試組接受所有實(shí)驗(yàn)處理纵顾,但組中每個(gè)被試只隨機(jī)地接受一種實(shí)驗(yàn)處理伍茄。
簡(jiǎn)答
一、什么是二項(xiàng)分布施逾?其平均數(shù)與標(biāo)準(zhǔn)差的意義有哪些敷矫?推論統(tǒng)計(jì)-數(shù)據(jù)分布
答:1)二項(xiàng)分布的定義:二項(xiàng)分布是指試驗(yàn)僅有兩種不同性質(zhì)結(jié)果的概率分布,即各個(gè)變量都可歸為兩個(gè)不同性質(zhì)中的一個(gè)汉额,兩個(gè)觀測(cè)值是對(duì)立的曹仗,即二項(xiàng)分布是兩個(gè)對(duì)立事件的概率分布。二項(xiàng)分布的具體定義是:有n次彼此獨(dú)立的試驗(yàn)蠕搜,每次試驗(yàn)?zāi)呈录ɑ虺晒κ录┏霈F(xiàn)的概率為p,某事件(或失敗事件)不出現(xiàn)的概率為q(=1-p)怎茫。
2)二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差意義
如果二項(xiàng)分布滿足p<q,np>=5(或p>q妓灌,nq>=5)時(shí)轨蛤,n被認(rèn)為很大蜜宪,二項(xiàng)分布接近正態(tài)分布。此時(shí)X變量(即成功的次數(shù))為μ=np, σ=√npq的正態(tài)分布祥山,其平均數(shù)和標(biāo)準(zhǔn)差是根據(jù)理論推導(dǎo)而來圃验,故用μ和σ表示。含義是在二項(xiàng)試驗(yàn)中枪蘑,成功次數(shù)的平均數(shù)μ=np损谦,成功次數(shù)的離散程度σ=√npq。在實(shí)際試驗(yàn)中岳颇,試驗(yàn)次數(shù)越多照捡,成功次數(shù)的平均數(shù)和分散程度越接近理論值μ和σ。二項(xiàng)分布應(yīng)用于解決含有機(jī)遇性質(zhì)的問題(區(qū)分實(shí)驗(yàn)結(jié)果是否由猜測(cè)造成的)
二话侧、何謂樣本平均數(shù)的分布栗精?推論統(tǒng)計(jì)-數(shù)據(jù)分布(20190331)
答:1)從正態(tài)分布的總體中可無限抽取所有可能的特定容量(大小為n)的隨機(jī)樣本,所計(jì)算的這無限多個(gè)樣本平均數(shù)的分布叫樣本平均數(shù)的分布瞻鹏。
2)按樣本平均數(shù)分布規(guī)律進(jìn)行推斷與解釋:當(dāng)總體分布為正態(tài)或近似正態(tài)分布悲立,總體方差已知,樣本平均數(shù)分布為正態(tài)分布新博,統(tǒng)計(jì)量服從正態(tài)分布薪夕,對(duì)樣本平均數(shù)的分布按正態(tài)分布解釋;當(dāng)總體為正態(tài)或接近正態(tài)赫悄,但總體方差未知原献,用樣本的方差代替總體的方差,統(tǒng)計(jì)量服從自由度為n-1的t分布埂淮,對(duì)樣本平均數(shù)的分布按t分布解釋姑隅。
三、何謂點(diǎn)估計(jì)與區(qū)間估計(jì)倔撞,它們各有哪些優(yōu)缺點(diǎn)? 推論統(tǒng)計(jì)-參數(shù)估計(jì)(點(diǎn)估計(jì)讲仰、區(qū)間估計(jì))
答:1)區(qū)間估計(jì)是指用數(shù)軸上一段距離,表示未知參數(shù)可能落入的范圍痪蝇。點(diǎn)估計(jì)是當(dāng)總體參數(shù)不清楚時(shí)鄙陡,用一個(gè)特定值(一般用樣本統(tǒng)計(jì)量)對(duì)其估計(jì)。
2)點(diǎn)估計(jì)的優(yōu)點(diǎn)是能夠提供總體參數(shù)的估計(jì)值霹俺,缺點(diǎn)是點(diǎn)估計(jì)總以誤差的存在為前提柔吼,且不能提供正確估計(jì)的概率。區(qū)間估計(jì)的優(yōu)點(diǎn)是不僅給出一個(gè)估計(jì)的范圍丙唧,還能給出估計(jì)精度并用概率說明估計(jì)結(jié)果的有把握程度,缺點(diǎn)是不能確定一個(gè)具體的估計(jì)值觅玻。
四想际、優(yōu)良點(diǎn)估計(jì)應(yīng)滿足什么條件培漏?推論統(tǒng)計(jì)-參數(shù)估計(jì)(點(diǎn)估計(jì))
答:1)無偏性:所有可能的統(tǒng)計(jì)量與參數(shù)真值的偏差的平均值為零。
2)一致性:當(dāng)樣本容量無限增大時(shí)胡本,估計(jì)值會(huì)越來越接近它所估計(jì)的總體參數(shù)牌柄。
3)有效性:若一個(gè)無偏估計(jì)量的方差對(duì)于其他無偏估計(jì)量的方差來說是最小的,那么它的取值是比較穩(wěn)定的侧甫,則這一估計(jì)值是有效的珊佣。
4)充分性:用作估計(jì)值的統(tǒng)計(jì)量能夠反映樣本全部數(shù)據(jù)所反映的總體的信息。
五披粟、說明下列各項(xiàng)因素如何影響置信區(qū)間的寬度:推論統(tǒng)計(jì)-參數(shù)估計(jì)(區(qū)間估計(jì))
(1)增加樣本量咒锻,(2)增加樣本的變異性,(3)提高置信度守屉。
答:1)樣本量對(duì)置信區(qū)間的影響:在置信水平固定的情況下惑艇,樣本量越多,置信區(qū)間越窄拇泛。
2)置信水平對(duì)置信區(qū)間的影響:在樣本量相同的情況下滨巴,置信水平越高,置信區(qū)間越寬俺叭。
3)增加樣本的變異性與置信區(qū)間的影響:變異越大恭取,說明樣本之間的差異越大,置信區(qū)間越寬熄守。
六蜈垮、簡(jiǎn)述假設(shè)檢驗(yàn)的基本過程。推論統(tǒng)計(jì)-假設(shè)檢驗(yàn)
答:1)根據(jù)問題要求柠横,提出虛無假設(shè)H0和研究假設(shè)H1
2)選擇適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量根據(jù)抽樣分布的原理窃款。
3)計(jì)算檢驗(yàn)統(tǒng)計(jì)量根據(jù)樣本資料計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的具體值。
4)規(guī)定顯著性水平牍氛,并根據(jù)檢驗(yàn)的類型查出臨界值根據(jù)顯著性水平和檢驗(yàn)類型晨继,通過統(tǒng)計(jì)量分布表查出臨界值,即拒絕域也隨之確定搬俊。
5)比較臨界值與統(tǒng)計(jì)值并進(jìn)行決策:用計(jì)算出的統(tǒng)計(jì)量的具體值與臨界值相比較紊扬,依據(jù)檢驗(yàn)統(tǒng)計(jì)量是否落在拒絕域中,做出接受或拒絕虛無假設(shè)的決策唉擂。如臨界值大于統(tǒng)計(jì)值餐屎,則接受H0,拒絕H1玩祟;反之腹缩,則拒絕H0,接受H1。
論述
一藏鹊、什么情況下適合用非參數(shù)方法進(jìn)行平均數(shù)差異的顯著性檢驗(yàn)润讥?推論統(tǒng)計(jì)-假設(shè)檢驗(yàn)
答:1)非參數(shù)檢驗(yàn)一般不需要嚴(yán)格的前提假設(shè),對(duì)總體分布不做嚴(yán)格假定盘寡,對(duì)樣本分布沒有要求楚殿。當(dāng)兩總體為非正態(tài)分布或分布形態(tài)未知時(shí)適合用非參數(shù)方法進(jìn)行平均數(shù)差異的顯著性檢驗(yàn)。
2)非參數(shù)檢驗(yàn)特別適用于順序類型的數(shù)據(jù)(等級(jí)變量)甚至稱名數(shù)據(jù)竿痰。
3)非參數(shù)檢驗(yàn)很適用于小樣本脆粥,且方法簡(jiǎn)單。心理學(xué)研究中一些規(guī)模較大的實(shí)驗(yàn)影涉,常常需要在正式實(shí)驗(yàn)前做一些實(shí)驗(yàn)变隔,要求被試較少且結(jié)果盡快處理,用非參數(shù)方法很方便常潮。
4)非參數(shù)方法最大不足是未能充分利用資料的全部信息弟胀。目前還不能處理“交互作用”。
5)采用非參數(shù)檢驗(yàn)進(jìn)行平均數(shù)差異的顯著性檢查的方法有:獨(dú)立樣本的秩和檢驗(yàn)法喊式、中數(shù)檢驗(yàn)法孵户,相關(guān)樣本的符號(hào)檢驗(yàn)法和符號(hào)秩次法(符號(hào)秩和檢驗(yàn)法)。
二岔留、參數(shù)檢驗(yàn)(如t或ANOVA)與非參數(shù)檢驗(yàn)(如卡方)主要差異在于它們要求的假定和需要的數(shù)據(jù)夏哭。解釋這些差異。推論統(tǒng)計(jì)-假設(shè)檢驗(yàn)
答:1)參數(shù)檢驗(yàn)是當(dāng)總體分布已知献联,對(duì)總體的未知參數(shù)進(jìn)行假設(shè)檢驗(yàn)竖配。如已知總體為正態(tài)分布,可進(jìn)一步知道樣本均值和方差有關(guān)總體均值和方差的充分統(tǒng)計(jì)量里逆;非參數(shù)檢驗(yàn)是當(dāng)總體分布未知进胯,或相關(guān)信息所知甚少,對(duì)未知分布函數(shù)的形式及其他特征進(jìn)行假設(shè)檢驗(yàn)原押。
2)參數(shù)檢驗(yàn)需要有一些嚴(yán)格的假設(shè)胁镐,一方面以明確或假定總體分布為前提,對(duì)總體未知參數(shù)進(jìn)行估計(jì)或檢驗(yàn)诸衔;一方面需要滿足某些總體參數(shù)的假定條件盯漂。若不滿足這些假設(shè)仍然用參數(shù)方法處理,很有可能得出錯(cuò)誤結(jié)論笨农;非參數(shù)檢驗(yàn)一般不需要對(duì)總體分布做嚴(yán)格的前提假設(shè)就缆。
3)參數(shù)檢驗(yàn)適用于等距或等比數(shù)據(jù)的檢驗(yàn);非參數(shù)檢驗(yàn)適合于計(jì)量信息較弱的資料谒亦,依據(jù)數(shù)據(jù)的順序竭宰、等級(jí)資料即可進(jìn)行統(tǒng)計(jì)推斷空郊,因此特別適用于順序數(shù)據(jù)(等級(jí)變量)甚至稱名數(shù)據(jù)。
4)非參數(shù)統(tǒng)計(jì)中與參數(shù)統(tǒng)計(jì)中使用的統(tǒng)計(jì)量不同羞延。由于非參數(shù)模型渣淳,在提煉樣本信息時(shí)脾还,不可能將樣本壓縮得十分緊湊而不損失信息伴箩。另外統(tǒng)計(jì)量的分布或至少是極限分布的,應(yīng)該與總體分布無關(guān)鄙漏。(此條為原答案嗤谚,個(gè)人認(rèn)為與原題無關(guān))
三、試述方差分析的基本原理及步驟(舉例說明)怔蚌。復(fù)雜統(tǒng)計(jì)分析-方差分析
答:方差分析為兩個(gè)或兩個(gè)以上的平均數(shù)差異的顯著性檢驗(yàn)巩步,以單因素方差分析為例來說明方差分析的基本原理及步驟。
1)方差分析的基本原理:
1.1)綜合虛無假設(shè)與部分虛無假設(shè):將“樣本所歸屬的所有總體的平均數(shù)都相等”的虛無假設(shè)稱為“綜合虛無假設(shè)”桦踊,組間的虛無假設(shè)稱為“部分虛無假設(shè)”
1.2)方差的可分解性:即方差的可加性椅野。方差分析將實(shí)驗(yàn)數(shù)據(jù)的總變異分解為若干不同來源的分量,就是將總平方和分解為幾個(gè)不同來源的平方和籍胯。變異來源:總變異SSt為實(shí)驗(yàn)中產(chǎn)生的總變異竟闪,組間變異SSb為不同實(shí)驗(yàn)處理造成的變異,組內(nèi)變異SSw為實(shí)驗(yàn)誤差造成的變異杖狼。SSt=SSb+SSw
2)方差分析的基本步驟:
1)求平方和
平方和為觀測(cè)數(shù)據(jù)與平均數(shù)離差的平方總和炼蛤。根據(jù)原始數(shù)據(jù),分別計(jì)算總平方和SSt蝶涩、組間平方和SSb與組內(nèi)平方和SSw
2)計(jì)算自由度
分別計(jì)算總自由度DFt理朋、組間自由度DFb與組內(nèi)自由度DFw
DFb =k-1 DFw=k(n-1) DFt=DFb+DFt=nk-1
3)計(jì)算均方(方差)
分別計(jì)算組間均方和組內(nèi)均方。均方=平方和/自由度 MS=SS/DF
MSb=SSb/DFbMSw=SSw/DFw
4)計(jì)算F值(效應(yīng)模型與F檢驗(yàn))
根據(jù)不同的效應(yīng)模型绿聘,選擇相應(yīng)的公式計(jì)算F值嗽上。F=組間均方/組內(nèi)均方=MSb/MSw
5)查F值表進(jìn)行F檢驗(yàn)并做出決斷
查F值表,根據(jù)F檢驗(yàn)確定二者差異是否達(dá)到顯著性水平熄攘,做出接受或拒絕虛無假設(shè)的決斷兽愤。如果計(jì)算的F值大于顯著性水平的臨界值,則可拒絕H0,即可以得出不同組平均數(shù)之間在統(tǒng)計(jì)上至少有一對(duì)存在顯著差異鲜屏。(方差分析結(jié)果存在顯著差異烹看,則須進(jìn)行事后檢驗(yàn)。即利用事后多重比較方法可進(jìn)一步判斷出是哪一對(duì)或哪幾對(duì)存在顯著差異)洛史。
6)陳列方差分析表
將以上步驟計(jì)算結(jié)果歸納成方差分析表惯殊,列于實(shí)驗(yàn)報(bào)告結(jié)尾。主要包括變異來源也殖、平方和土思、自由度务热、均方、F值和P值己儒。