Q1:在假設(shè)檢驗中,原假設(shè)和備擇假設(shè)常用的劃分方法是什么?
1.原假設(shè)和備擇假設(shè)
-
原假設(shè)記為H0虽界,備擇假設(shè)記為H1
-
備擇假設(shè)實際上是我們真正需要關(guān)心和證明的
-
H0和H1的選擇是基于實際的需要,不是隨機選擇的
2.檢驗統(tǒng)計量
-
檢驗統(tǒng)計量是用于假設(shè)檢驗計算的統(tǒng)計量,基于樣本檢驗統(tǒng)計量的值來接受或者拒絕原假設(shè)
-
常用的檢驗統(tǒng)計量:t統(tǒng)計量枷餐、z統(tǒng)計量
-
在原假設(shè)成立的情況下,檢驗統(tǒng)計量服從一個特定的分布
-
在備擇假設(shè)成立的情況下苫亦,則不服從該分布
Q2:簡述假設(shè)檢驗的基本思想
1.比較通俗的闡述
通過證明在原假設(shè)成立的前提下毛肋,檢驗統(tǒng)計量出現(xiàn)當前值或者更為極端的值屬于“小概率”事件,以此推翻原假設(shè)屋剑,接受備擇假設(shè)润匙。
"檢驗統(tǒng)計量出現(xiàn)當前值或者更為極端的值"的概率就是p-value
“小概率”:將p-value與預先定義的顯著性水平α對比,如果p-value小于α唉匾,就可以推翻原假設(shè)
2.更為嚴謹?shù)年U述
通過證明該樣本對應(yīng)的p-value小于α孕讳,以此推翻原假設(shè),接受備擇假設(shè)
Q3:解釋假設(shè)檢驗中的兩類錯誤巍膘。
-
第一類錯誤:在原假設(shè)成立的情況下厂财,錯誤地拒絕了原假設(shè)
-
第二類錯誤:沒有成功地拒絕不成立的原假設(shè)
Q4:在假設(shè)檢驗中,如何平衡兩類錯誤峡懈?
1.顯著性水平
-
預先設(shè)定犯第一類錯誤的上限(定義顯著性水平α)
-
1-α被稱為置信度
-
α通常設(shè)定為5%(部分比較嚴格的檢驗中蟀苛,設(shè)定為1%)
-
當樣本對應(yīng)的p-value小于α時,原假設(shè)會被拒絕
2.檢驗效能
-
在顯著性水平固定的情況下逮诲,需要減少第二類錯誤β發(fā)生的概率
-
1-β為規(guī)避第二類錯誤的概率帜平,用power表示,又稱為檢驗效能
-
power的大小可以通過增加樣本量來提高
-
通常需要power達到80%或者更高的水平
通過預先設(shè)定的顯著性水平和檢驗效能梅鹦,可以計算出完成試驗所需要的最小樣本量
Q5:簡述假設(shè)檢驗中的p-value裆甩、顯著性水平、置信度齐唆、檢驗效能嗤栓。
-
p-value:在原假設(shè)成立的前提下,檢驗統(tǒng)計量出現(xiàn)當前值或更為極端的值的概率
-
顯著性水平:在假設(shè)檢驗中,犯第一類錯誤的上限茉帅,用α表示
-
置信度:用1-α表示檢驗的置信度
-
檢驗效能:規(guī)避第二類錯誤的概率叨叙,用power表示
Q6:z檢驗和t檢驗之間有什么區(qū)別?
常用的基于正態(tài)分布的檢驗方法:z檢驗和t檢驗
1.z檢驗
假設(shè)x1,x2,x3,...是一組正態(tài)分布的樣本堪澎,已知方差為σ擂错,要判斷該正態(tài)分布的均值μ是否等于μ0,
-
原假設(shè)
-
備擇假設(shè)
-
在H0成立的前提下,構(gòu)造檢驗統(tǒng)計量樱蛤,要求的顯著性水平為α钮呀,則
-
若檢驗統(tǒng)計量的值落在[α/2,1-α/2]分位數(shù)之外,則表明p-value小于α昨凡,可以拒絕原假設(shè)爽醋;反之,則無法拒絕原假設(shè)
2.t檢驗
假設(shè)x1,x2,x3,...是一組正態(tài)分布的樣本便脊,方差未知蚂四,要判斷該正態(tài)分布的均值μ是否等于μ0
-
用樣本的方差s代替z檢驗中已知的方差構(gòu)造檢驗統(tǒng)計量X'
其中,
-
同理哪痰,若檢驗統(tǒng)計量的值落在[α/2,1-α/2]分位數(shù)之外遂赠,則可以拒絕原假設(shè)
參考文獻
1.《拿下Offer 數(shù)據(jù)分析師求職面試指南》徐麟 著