1.說(shuō)一下大數(shù)定理?
1.通俗地說(shuō)沪饺,在試驗(yàn)不變的條件下躏敢,重復(fù)試驗(yàn)多次,隨機(jī)事件的頻率近似于它的概率整葡。偶然中包含著必然件余。
2.不同的大數(shù)定理主要討論在一下不同條件下,隨機(jī)變量序列的算術(shù)平均依概率收斂到其均值的算術(shù)平均遭居。
3.大數(shù)定律總的講啼器,有伯努利大數(shù)定律,切比雪夫大數(shù)定律俱萍,馬爾科夫大數(shù)定律镀首,辛欽大數(shù)定律
其中
伯努利大數(shù)定理:是講在n次伯努利實(shí)驗(yàn)中也就是獨(dú)立同分布的情況下。
-
切比雪夫大數(shù)定律是:設(shè){X_n}為一列兩兩不相關(guān)的隨機(jī)變量序列鼠次,若每個(gè)
的方差存在更哄,且有共同的上界芋齿,
伯努利大數(shù)定律是切比雪夫大數(shù)定律的特殊情況。
-
馬兒科夫大數(shù)定律:隨機(jī)變量序列滿足微信截圖_20190909182022.png
的情況下成翩,不要求獨(dú)立觅捆,不要求滿足同分布。
- 辛欽大數(shù)定律:獨(dú)立同分布的隨機(jī)序列麻敌,若存在數(shù)學(xué)期望
2.說(shuō)一下中心極限定理栅炒?
1.中心極限定理討論隨機(jī)變量序列部分和分布漸近于正態(tài)分布的一類定理
2.中心極限定理主要有獨(dú)立同分布下的正態(tài)近似、二項(xiàng)分布的正態(tài)近似术羔、獨(dú)立不同分布下的正態(tài)近似
3.卡方分布是什么赢赊?
-
定義:n個(gè)獨(dú)立同分布標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量,這n個(gè)隨機(jī)變量平方和的分布稱為自由度為
的卡方分布级历。
卡方分布也就是伽馬分布的特例释移,是n個(gè)獨(dú)立伽馬分布和的分布
-
密度函數(shù):微信截圖_20190909184731.png
-
圖像:微信截圖_20190909184825.png
-
性質(zhì):微信截圖_20190909185304.png
-
分位數(shù):微信截圖_20190909185847.png
-
例子:微信截圖_20190909190132.png
4.t分布是什么
- 定義:
- 密度函數(shù)
- 圖像:對(duì)稱
- 性質(zhì):趨近正態(tài)分布
- 分位數(shù):
5.F分布是什么?
- 性質(zhì):
- F分布的倒數(shù)還是F分布
- 分位數(shù):
-
若微信截圖_20190909192038.png
6.一些推論寥殖?
7.AB test
-
什么是ABtest
答:將Web或App界面或流程的兩個(gè)或多個(gè)版本玩讳,在同一時(shí)間維度,分別組成成分相同(相似)的訪客群組訪問(wèn)嚼贡,收集各群組的用戶體驗(yàn)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)熏纯,最后分析評(píng)估出最好版本正式采用。
AB測(cè)試強(qiáng)調(diào)的是同一時(shí)間維度對(duì)相似屬性分組用戶的測(cè)試粤策,時(shí)間的統(tǒng)一性有效的規(guī)避了因?yàn)闀r(shí)間樟澜、季節(jié)等因素帶來(lái)的影響,而屬性的相似性則使得地域叮盘、性別秩贰、年齡等等其他因素對(duì)效果統(tǒng)計(jì)的影響降至最低
-
abtest 流程
AB測(cè)試是一個(gè)反復(fù)迭代優(yōu)化的過(guò)程,它的基本步驟如下圖所示可以劃分為:
1.設(shè)定項(xiàng)目目標(biāo)即AB測(cè)試的目標(biāo)
2.設(shè)計(jì)優(yōu)化的迭代開(kāi)發(fā)方案熊户,完成新模塊的開(kāi)發(fā)
3.確定實(shí)施的版本以及每個(gè)線上測(cè)試版本的分流比例
4.按照分流比例開(kāi)放線上流量進(jìn)行測(cè)試(要保證實(shí)驗(yàn)的有效性,要確定分流是否已經(jīng)到達(dá)所需要的最小樣本量)
5.收集實(shí)驗(yàn)數(shù)據(jù)進(jìn)行有效性和效果判斷
6.根據(jù)試驗(yàn)結(jié)果確定發(fā)布新版本吭服、調(diào)整分流比例繼續(xù)測(cè)試或者在試驗(yàn)效果未達(dá)成的情況下繼續(xù)優(yōu)化迭代方案重新開(kāi)發(fā)上線試驗(yàn)
-
abtest的注意事項(xiàng)
用戶的有效分組以及如何判斷實(shí)驗(yàn)中不同分組用戶屬性的相似性
試驗(yàn)過(guò)程中如何收集用戶的體驗(yàn)和業(yè)務(wù)數(shù)據(jù)嚷堡,如何對(duì)收集的數(shù)據(jù)進(jìn)行分析并判斷不同版本間的優(yōu)劣
影響用戶決策的新產(chǎn)品上線和其他具有風(fēng)險(xiǎn)性的功能上線通常采用先從小流量測(cè)試開(kāi)始,然后逐步放大測(cè)試流量的方法艇棕。但是蝌戒,測(cè)試版本的流量如果太小又可能造成隨機(jī)結(jié)果的引入,試驗(yàn)結(jié)果失去統(tǒng)計(jì)意義沼琉。
-
為了規(guī)避樣本量帶來(lái)的不足我們可以:
1.試驗(yàn)設(shè)計(jì)時(shí)預(yù)估進(jìn)入試驗(yàn)的樣本量北苟,做分流規(guī)劃時(shí)避免分配給測(cè)試集的樣本量過(guò)少。
2.除了進(jìn)行AB測(cè)試外增加關(guān)于數(shù)據(jù)有效性考量的AA測(cè)試打瘪,將原始版本的流量中分出兩個(gè)和測(cè)試版本相同的流量也進(jìn)入測(cè)試友鼻。例如:為測(cè)試一個(gè)新的功能傻昙,我們?cè)緶?zhǔn)備劃分90%流量給老版本,10%流量給新版本彩扔;這時(shí)我們可以分配70%流量給老版本A妆档,同時(shí)生成兩個(gè)10%流量的老版本C和D進(jìn)行AA測(cè)試,然后把剩余的10%流量給新版本B虫碉;在試驗(yàn)過(guò)程中通過(guò)考察分配給老版本C和D的兩股流量是否存在顯著性差異贾惦,從而認(rèn)定試驗(yàn)分流是否有效。
3.如果參與測(cè)試新版本已經(jīng)分配了很大的流量比例敦捧,但是仍然存在樣本量不足的情況须板,這時(shí)就只能通過(guò)拉長(zhǎng)試驗(yàn)時(shí)間的方式來(lái)累積足夠的樣本量進(jìn)行比較了。需要參考用戶的行為周期兢卵。
多層次正交的實(shí)驗(yàn)方式使多個(gè)并發(fā)實(shí)驗(yàn)都可以保證具備一定流量的并行進(jìn)行
-
假設(shè)檢驗(yàn)流程
- 建立假設(shè)(常將沒(méi)有充分理由不能否定的命題作為原假設(shè))
- 選擇檢驗(yàn)統(tǒng)計(jì)量
- 選擇顯著性水平
- 計(jì)算拒絕域或是計(jì)算P值
- 得出結(jié)論
-
假設(shè)檢驗(yàn)的原理:小概率原理
-
兩類錯(cuò)誤:
- 第一類錯(cuò)誤(拒真錯(cuò)誤习瑰、顯著性水平):
為真,但是由于隨機(jī)性济蝉,統(tǒng)計(jì)檢驗(yàn)量落在了拒絕域內(nèi)
- 第二類錯(cuò)誤(取偽錯(cuò)誤):
為假杰刽,但是由于隨機(jī)性,統(tǒng)計(jì)檢驗(yàn)量落在了接收域內(nèi)王滤。
- 兩者的大小是相對(duì)的贺嫂,一個(gè)減小勢(shì)必導(dǎo)致另一個(gè)增加。所以要在適當(dāng)控制拒真錯(cuò)誤中制約取偽錯(cuò)誤雁乡。
- 第一類錯(cuò)誤(拒真錯(cuò)誤习瑰、顯著性水平):
-
檢驗(yàn)P值:
利用樣本觀測(cè)值能夠做出拒絕原假設(shè)的最小顯著性水平稱為檢驗(yàn)P值
-
勢(shì)函數(shù)或者功效函數(shù)
樣本觀測(cè)值落在拒絕域內(nèi)的概率稱為該檢驗(yàn)的勢(shì)函數(shù)第喳。
-
假設(shè)檢驗(yàn)的分類
-
單個(gè)正態(tài)總體均值的檢驗(yàn)
-
方差已知時(shí)的檢驗(yàn)
微信截圖_20190909225442.png -
方差未知時(shí)的檢驗(yàn)
微信截圖_20190909225459.png
-
兩個(gè)正態(tài)總體均值差的檢驗(yàn)
- 方差已知的檢驗(yàn)
-
- 方差相等但是未知的檢驗(yàn)
-
單個(gè)正態(tài)總體方差的卡方檢驗(yàn)
微信截圖_20190909225913.png
- 兩個(gè)正態(tài)總體方差的F檢驗(yàn)
