基礎(chǔ)知識(四)統(tǒng)計&數(shù)據(jù)分析知識——假設(shè)檢驗

思維導圖

Q1:在假設(shè)檢驗中,原假設(shè)和備擇假設(shè)常用的劃分方法是什么?

1.原假設(shè)和備擇假設(shè)

  • 原假設(shè)記為H0虽界,備擇假設(shè)記為H1

  • 備擇假設(shè)實際上是我們真正需要關(guān)心和證明的

  • H0和H1的選擇是基于實際的需要,不是隨機選擇的

2.檢驗統(tǒng)計量

  • 檢驗統(tǒng)計量是用于假設(shè)檢驗計算的統(tǒng)計量,基于樣本檢驗統(tǒng)計量的值來接受或者拒絕原假設(shè)

  • 常用的檢驗統(tǒng)計量:t統(tǒng)計量枷餐、z統(tǒng)計量

  • 在原假設(shè)成立的情況下,檢驗統(tǒng)計量服從一個特定的分布

  • 在備擇假設(shè)成立的情況下苫亦,則不服從該分布


Q2:簡述假設(shè)檢驗的基本思想

1.比較通俗的闡述

通過證明在原假設(shè)成立的前提下毛肋,檢驗統(tǒng)計量出現(xiàn)當前值或者更為極端的值屬于“小概率”事件,以此推翻原假設(shè)屋剑,接受備擇假設(shè)润匙。

"檢驗統(tǒng)計量出現(xiàn)當前值或者更為極端的值"的概率就是p-value
“小概率”:將p-value與預先定義的顯著性水平α對比,如果p-value小于α唉匾,就可以推翻原假設(shè)

2.更為嚴謹?shù)年U述

通過證明該樣本對應(yīng)的p-value小于α孕讳,以此推翻原假設(shè),接受備擇假設(shè)


Q3:解釋假設(shè)檢驗中的兩類錯誤巍膘。

  • 第一類錯誤:在原假設(shè)成立的情況下厂财,錯誤地拒絕了原假設(shè)

  • 第二類錯誤:沒有成功地拒絕不成立的原假設(shè)


Q4:在假設(shè)檢驗中,如何平衡兩類錯誤峡懈?

1.顯著性水平

  • 預先設(shè)定犯第一類錯誤的上限(定義顯著性水平α)

  • 1-α被稱為置信度

  • α通常設(shè)定為5%(部分比較嚴格的檢驗中蟀苛,設(shè)定為1%)

  • 當樣本對應(yīng)的p-value小于α時,原假設(shè)會被拒絕

2.檢驗效能

  • 在顯著性水平固定的情況下逮诲,需要減少第二類錯誤β發(fā)生的概率

  • 1-β為規(guī)避第二類錯誤的概率帜平,用power表示,又稱為檢驗效能

  • power的大小可以通過增加樣本量來提高

  • 通常需要power達到80%或者更高的水平

通過預先設(shè)定的顯著性水平和檢驗效能梅鹦,可以計算出完成試驗所需要的最小樣本量


Q5:簡述假設(shè)檢驗中的p-value裆甩、顯著性水平、置信度齐唆、檢驗效能嗤栓。

  • p-value:在原假設(shè)成立的前提下,檢驗統(tǒng)計量出現(xiàn)當前值或更為極端的值的概率

  • 顯著性水平:在假設(shè)檢驗中,犯第一類錯誤的上限茉帅,用α表示

  • 置信度:用1-α表示檢驗的置信度

  • 檢驗效能:規(guī)避第二類錯誤的概率叨叙,用power表示


Q6:z檢驗和t檢驗之間有什么區(qū)別?

常用的基于正態(tài)分布的檢驗方法:z檢驗和t檢驗

1.z檢驗

假設(shè)x1,x2,x3,...是一組正態(tài)分布的樣本堪澎,已知方差為σ擂错,要判斷該正態(tài)分布的均值μ是否等于μ0,

  • 原假設(shè)

  • 備擇假設(shè)

  • 在H0成立的前提下,構(gòu)造檢驗統(tǒng)計量樱蛤,要求的顯著性水平為α钮呀,則

  • 若檢驗統(tǒng)計量的值落在[α/2,1-α/2]分位數(shù)之外,則表明p-value小于α昨凡,可以拒絕原假設(shè)爽醋;反之,則無法拒絕原假設(shè)

2.t檢驗

假設(shè)x1,x2,x3,...是一組正態(tài)分布的樣本便脊,方差未知蚂四,要判斷該正態(tài)分布的均值μ是否等于μ0

  • 用樣本的方差s代替z檢驗中已知的方差構(gòu)造檢驗統(tǒng)計量X'

其中,

  • 同理哪痰,若檢驗統(tǒng)計量的值落在[α/2,1-α/2]分位數(shù)之外遂赠,則可以拒絕原假設(shè)


參考文獻

1.《拿下Offer 數(shù)據(jù)分析師求職面試指南》徐麟 著

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市妒御,隨后出現(xiàn)的幾起案子解愤,更是在濱河造成了極大的恐慌镇饺,老刑警劉巖乎莉,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異奸笤,居然都是意外死亡惋啃,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門监右,熙熙樓的掌柜王于貴愁眉苦臉地迎上來边灭,“玉大人,你說我怎么就攤上這事健盒∪奘荩” “怎么了?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵扣癣,是天一觀的道長惰帽。 經(jīng)常有香客問我,道長父虑,這世上最難降的妖魔是什么该酗? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上呜魄,老公的妹妹穿的比我還像新娘悔叽。我一直安慰自己,他們只是感情好爵嗅,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布娇澎。 她就那樣靜靜地躺著,像睡著了一般操骡。 火紅的嫁衣襯著肌膚如雪九火。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天册招,我揣著相機與錄音岔激,去河邊找鬼。 笑死是掰,一個胖子當著我的面吹牛虑鼎,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播键痛,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼炫彩,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了絮短?” 一聲冷哼從身側(cè)響起江兢,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎丁频,沒想到半個月后杉允,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡席里,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年叔磷,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片奖磁。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡改基,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出咖为,到底是詐尸還是另有隱情秕狰,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布躁染,位于F島的核電站鸣哀,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏褐啡。R本人自食惡果不足惜诺舔,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧低飒,春花似錦许昨、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至拌喉,卻和暖如春速那,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背尿背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工端仰, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人田藐。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓荔烧,卻偏偏與公主長得像,于是被迫代替她去往敵國和親汽久。 傳聞我的和親對象是個殘疾皇子鹤竭,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容