概率與數理統(tǒng)計學習筆記2-假設檢驗

假設檢驗的目的:判斷樣本與樣本张遭,樣本與總體的差異是由抽樣誤差造成還是本質差別造成;或是為了判斷推斷總體特征作出的假設是否應該接受

名詞解釋

  • 顯著性水平:原假設為真卻被拒絕的概率(簡稱棄真概率)
  • 提出相互對立的兩個假設枫笛。原假設H0通常是要被反駁的假設斩熊,備擇假設H1是認為相對正確的假設
  • 檢驗統(tǒng)計量:統(tǒng)計量差值做過標準化之后的值(下文用差異標準值代替)
  • 拒絕域:檢驗結果落入此區(qū)域會被拒絕

假設檢驗的驗證方式有2種:

1.統(tǒng)計量值作判斷:

根據實際情況粥谬,提出假設,通常是統(tǒng)計量之間的對比像鸡,比如樣本1的平均值<=樣本2的平均值勘高。對統(tǒng)計量差值進行標準化操作,得到標準值坟桅。要判斷差異標準值在什么范圍算是顯著差異华望,什么范圍算是正常差異值,就規(guī)定一個k值作為判斷差異值大小的衡量標準仅乓,也就是在差異標準值>=k時算是樣本差異顯著赖舟。但是不能直接判斷出k值的大小,所以通過運用棄真概率控制在小概率的方法夸楣,得到差異標準值與k的比較結果宾抓,以此來拒絕或者接受原假設。

棄真是指原假設為真卻被拒絕的情況豫喧,這種情況為不能消除的小概率事件石洗,所以將差異標準值>=k(拒絕情況)的概率控制在a,a在概率密度曲線上的面積稱為拒絕域紧显,在原假設成立的情況下讲衫,比較差異標準值是否在拒絕域內,如果是孵班,則證明差異顯著涉兽,需要拒絕原假設,否則接受原假設篙程。

2.p值作判斷:

根據實際情況枷畏,提出假設,通常是統(tǒng)計量之間的對比虱饿,比如樣本1的平均值<=樣本2的平均值拥诡。對統(tǒng)計量差值進行標準化操作,得到標準值氮发。和統(tǒng)計量值判斷方式不一樣的是渴肉,根據差值出現(xiàn)的概率判斷是否是小概率事件,也就是判斷是不是極端情況的出現(xiàn)折柠。

要判斷差值出現(xiàn)的概率在什么范圍算是小概率宾娜,什么范圍算大概率批狐,就規(guī)定了顯著性水平a作為判斷標準扇售,如果差值出現(xiàn)的概率比a大前塔,說明是大概率范圍事件,即抽樣誤差造成承冰,所以接受原假設华弓。如果差值出現(xiàn)的概率比a小,說明樣本差值為極端情況困乒,屬于小概率事件寂屏。根據小概率事件原理,小概率事件是不會在一次試驗中出現(xiàn)的娜搂,所以說明差值為本質差異迁霎,不是誤差造成,所以拒絕原假設百宇。

abtest假設檢驗運用操作流程:

  1. 實驗背景:做abtest的項目介紹
    1.1 實驗策略:ab對比具體內容
    1.2 策略目標:目的是為了改變什么
  2. 指標選擇:
    2.1 第一類指標:健康檢驗指標考廉,為確保新上線策略不會發(fā)生原則性錯誤,并對每個指標確定一個dmin携御,實際最小變化昌粤,以防即使結果顯著,但是對企業(yè)來說不切實際
    2.2 第二類指標:希望有所變化的指標啄刹,和產品商業(yè)目標有關
    2.3 收集基線數據:得到日常指標數據用做對比
  3. 樣本選擇:
    3.1 選出ab實驗樣本:抽取4-5份流量空跑涮坐,對比指標,得到數據最接近的兩組數據誓军,作為ab實驗樣本總體數據
    3.2 樣本量計算:計算出多大的樣本就能計算出樣本間的差異袱讹,使用功效函數
    3.3 確定樣本量并開始做ab實驗
  4. abtest實驗數據分析:
    4.1 收集數據
    4.2 估計統(tǒng)計量的總體分布:一般符合正態(tài)分布
    4.3 結合實際判斷檢驗類型:(類型總結在附錄)
    4.4 作出假設
    4.5 計算結果分析:是否拒絕原假設,是否符合dmin
    4.6 總結反思出報告

takeaway:

我自己在做了幾次abtest假設檢驗之后有些反思和感悟:

  • 假設檢驗本就是驗證相近數據的差異是否顯著昵时,所以對于原數據相差較遠的數據沒有必要進行假設檢驗。所以檢驗前的描述性統(tǒng)計也很重要
  • 樣本估計是估計在一定概率下债查,能檢測出數據顯著結果的最小樣本容量。是幫助減少第一類錯誤的方式盹廷,同時也幫助成本優(yōu)化
  • 置信區(qū)間與假設檢驗的關系就是可以互相印證的關系,置信區(qū)間計算出的結果是假設檢驗的非拒絕域俄占,假設檢驗計算出的結果是置信區(qū)間的非區(qū)間域管怠,置信區(qū)間用的是1-a,假設檢驗用的是a而已缸榄。

附錄:

image.png

參考文獻[推薦文章]:
[1] https://zhuanlan.zhihu.com/p/145416879
[2] https://zhuanlan.zhihu.com/p/128435866
[3] https://zhuanlan.zhihu.com/p/26810566
[4] http://www.reibang.com/p/11f91c292bd1
[5] [概率論與數理統(tǒng)計(第四版)].盛驟&謝式千&潘承毅

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末渤弛,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子她肯,更是在濱河造成了極大的恐慌佳头,老刑警劉巖晴氨,帶你破解...
    沈念sama閱讀 217,277評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件康嘉,死亡現(xiàn)場離奇詭異,居然都是意外死亡籽前,警方通過查閱死者的電腦和手機亭珍,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評論 3 393
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來枝哄,“玉大人,你說我怎么就攤上這事挠锥。” “怎么了瘪贱?”我有些...
    開封第一講書人閱讀 163,624評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長甜害。 經常有香客問我,道長尔店,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,356評論 1 293
  • 正文 為了忘掉前任嚣州,我火速辦了婚禮,結果婚禮上该肴,老公的妹妹穿的比我還像新娘。我一直安慰自己匀哄,他們只是感情好,可當我...
    茶點故事閱讀 67,402評論 6 392
  • 文/花漫 我一把揭開白布涎嚼。 她就那樣靜靜地躺著挑秉,像睡著了一般法梯。 火紅的嫁衣襯著肌膚如雪犀概。 梳的紋絲不亂的頭發(fā)上立哑,一...
    開封第一講書人閱讀 51,292評論 1 301
  • 那天,我揣著相機與錄音滥嘴,去河邊找鬼木蹬。 笑死至耻,一個胖子當著我的面吹牛,可吹牛的內容都是我干的镊叁。 我是一名探鬼主播尘颓,決...
    沈念sama閱讀 40,135評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼晦譬!你這毒婦竟也來了疤苹?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 38,992評論 0 275
  • 序言:老撾萬榮一對情侶失蹤敛腌,失蹤者是張志新(化名)和其女友劉穎卧土,沒想到半個月后,有當地人在樹林里發(fā)現(xiàn)了一具尸體像樊,經...
    沈念sama閱讀 45,429評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,636評論 3 334
  • 正文 我和宋清朗相戀三年生棍,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片涂滴。...
    茶點故事閱讀 39,785評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖缔杉,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情搁料,我是刑警寧澤,帶...
    沈念sama閱讀 35,492評論 5 345
  • 正文 年R本政府宣布鸭叙,位于F島的核電站,受9級特大地震影響沈贝,放射性物質發(fā)生泄漏。R本人自食惡果不足惜勋乾,卻給世界環(huán)境...
    茶點故事閱讀 41,092評論 3 328
  • 文/蒙蒙 一宋下、第九天 我趴在偏房一處隱蔽的房頂上張望嗡善。 院中可真熱鬧,春花似錦学歧、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽横浑。三九已至,卻和暖如春徙融,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背欺冀。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留饺饭,地道東北人。 一個月前我還...
    沈念sama閱讀 47,891評論 2 370
  • 正文 我出身青樓砰奕,卻偏偏與公主長得像,于是被迫代替她去往敵國和親军援。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,713評論 2 354