面試

1.說(shuō)一下大數(shù)定理?

1.通俗地說(shuō)沪饺,在試驗(yàn)不變的條件下躏敢,重復(fù)試驗(yàn)多次,隨機(jī)事件的頻率近似于它的概率整葡。偶然中包含著必然件余。

2.不同的大數(shù)定理主要討論在一下不同條件下,隨機(jī)變量序列的算術(shù)平均依概率收斂到其均值的算術(shù)平均遭居。

微信截圖_20190909142330.png

3.大數(shù)定律總的講啼器,有伯努利大數(shù)定律,切比雪夫大數(shù)定律俱萍,馬爾科夫大數(shù)定律镀首,辛欽大數(shù)定律

其中

  • 伯努利大數(shù)定理:是講在n次伯努利實(shí)驗(yàn)中也就是獨(dú)立同分布的情況下。

  • 切比雪夫大數(shù)定律是:設(shè){X_n}為一列兩兩不相關(guān)的隨機(jī)變量序列鼠次,若每個(gè)X_i的方差存在更哄,且有共同的上界芋齿,

    伯努利大數(shù)定律是切比雪夫大數(shù)定律的特殊情況。

  • 馬兒科夫大數(shù)定律:隨機(jī)變量序列滿足
    微信截圖_20190909182022.png

    的情況下成翩,不要求獨(dú)立觅捆,不要求滿足同分布。

  • 辛欽大數(shù)定律:獨(dú)立同分布的隨機(jī)序列麻敌,若存在數(shù)學(xué)期望

2.說(shuō)一下中心極限定理栅炒?

1.中心極限定理討論隨機(jī)變量序列部分和分布漸近于正態(tài)分布的一類定理

2.中心極限定理主要有獨(dú)立同分布下的正態(tài)近似、二項(xiàng)分布的正態(tài)近似术羔、獨(dú)立不同分布下的正態(tài)近似

3.卡方分布是什么赢赊?

  • 定義:n個(gè)獨(dú)立同分布標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量,這n個(gè)隨機(jī)變量平方和的分布稱為自由度為n的卡方分布级历。

    卡方分布也就是伽馬分布的特例释移,是n個(gè)獨(dú)立伽馬分布和的分布

  • 密度函數(shù):
    微信截圖_20190909184731.png
  • 圖像:
    微信截圖_20190909184825.png
  • 性質(zhì):
    微信截圖_20190909185304.png
  • 分位數(shù):
    微信截圖_20190909185847.png
  • 例子:
    微信截圖_20190909190132.png

4.t分布是什么

微信截圖_20190909153635.png
微信截圖_20190909153819.png

微信截圖_20190909191025.png
  • 定義:
  • 密度函數(shù)
  • 圖像:對(duì)稱
  • 性質(zhì):趨近正態(tài)分布
  • 分位數(shù):

5.F分布是什么?

微信截圖_20190909153546.png

-- 密度函數(shù):
微信截圖_20190909191450.png
微信截圖_20190909191535.png
微信截圖_20190909191605.png
  • 性質(zhì):
    • F分布的倒數(shù)還是F分布
  • 分位數(shù):
  • 微信截圖_20190909192038.png

6.一些推論寥殖?

微信截圖_20190909192519.png
微信截圖_20190909193023.png
微信截圖_20190909193232.png
微信截圖_20190909193642.png
微信截圖_20190909194547.png
微信截圖_20190909194722.png
微信截圖_20190909194842.png
微信截圖_20190909195001.png

微信截圖_20190909195202.png

7.AB test

  • 什么是ABtest

    答:將Web或App界面或流程的兩個(gè)或多個(gè)版本玩讳,在同一時(shí)間維度,分別組成成分相同(相似)的訪客群組訪問(wèn)嚼贡,收集各群組的用戶體驗(yàn)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)熏纯,最后分析評(píng)估出最好版本正式采用。

    AB測(cè)試強(qiáng)調(diào)的是同一時(shí)間維度對(duì)相似屬性分組用戶的測(cè)試粤策,時(shí)間的統(tǒng)一性有效的規(guī)避了因?yàn)闀r(shí)間樟澜、季節(jié)等因素帶來(lái)的影響,而屬性的相似性則使得地域叮盘、性別秩贰、年齡等等其他因素對(duì)效果統(tǒng)計(jì)的影響降至最低

  • abtest 流程

    AB測(cè)試是一個(gè)反復(fù)迭代優(yōu)化的過(guò)程,它的基本步驟如下圖所示可以劃分為:

    1.設(shè)定項(xiàng)目目標(biāo)即AB測(cè)試的目標(biāo)

    2.設(shè)計(jì)優(yōu)化的迭代開(kāi)發(fā)方案熊户,完成新模塊的開(kāi)發(fā)

    3.確定實(shí)施的版本以及每個(gè)線上測(cè)試版本的分流比例

    4.按照分流比例開(kāi)放線上流量進(jìn)行測(cè)試(要保證實(shí)驗(yàn)的有效性,要確定分流是否已經(jīng)到達(dá)所需要的最小樣本量)

    5.收集實(shí)驗(yàn)數(shù)據(jù)進(jìn)行有效性和效果判斷

    6.根據(jù)試驗(yàn)結(jié)果確定發(fā)布新版本吭服、調(diào)整分流比例繼續(xù)測(cè)試或者在試驗(yàn)效果未達(dá)成的情況下繼續(xù)優(yōu)化迭代方案重新開(kāi)發(fā)上線試驗(yàn)

  • abtest的注意事項(xiàng)

    • 用戶的有效分組以及如何判斷實(shí)驗(yàn)中不同分組用戶屬性的相似性

    • 試驗(yàn)過(guò)程中如何收集用戶的體驗(yàn)和業(yè)務(wù)數(shù)據(jù)嚷堡,如何對(duì)收集的數(shù)據(jù)進(jìn)行分析并判斷不同版本間的優(yōu)劣

    • 影響用戶決策的新產(chǎn)品上線和其他具有風(fēng)險(xiǎn)性的功能上線通常采用先從小流量測(cè)試開(kāi)始,然后逐步放大測(cè)試流量的方法艇棕。但是蝌戒,測(cè)試版本的流量如果太小又可能造成隨機(jī)結(jié)果的引入,試驗(yàn)結(jié)果失去統(tǒng)計(jì)意義沼琉。

    • 為了規(guī)避樣本量帶來(lái)的不足我們可以:

      1.試驗(yàn)設(shè)計(jì)時(shí)預(yù)估進(jìn)入試驗(yàn)的樣本量北苟,做分流規(guī)劃時(shí)避免分配給測(cè)試集的樣本量過(guò)少。

      2.除了進(jìn)行AB測(cè)試外增加關(guān)于數(shù)據(jù)有效性考量的AA測(cè)試打瘪,將原始版本的流量中分出兩個(gè)和測(cè)試版本相同的流量也進(jìn)入測(cè)試友鼻。例如:為測(cè)試一個(gè)新的功能傻昙,我們?cè)緶?zhǔn)備劃分90%流量給老版本,10%流量給新版本彩扔;這時(shí)我們可以分配70%流量給老版本A妆档,同時(shí)生成兩個(gè)10%流量的老版本C和D進(jìn)行AA測(cè)試,然后把剩余的10%流量給新版本B虫碉;在試驗(yàn)過(guò)程中通過(guò)考察分配給老版本C和D的兩股流量是否存在顯著性差異贾惦,從而認(rèn)定試驗(yàn)分流是否有效。

      3.如果參與測(cè)試新版本已經(jīng)分配了很大的流量比例敦捧,但是仍然存在樣本量不足的情況须板,這時(shí)就只能通過(guò)拉長(zhǎng)試驗(yàn)時(shí)間的方式來(lái)累積足夠的樣本量進(jìn)行比較了。需要參考用戶的行為周期兢卵。

    • 多層次正交的實(shí)驗(yàn)方式使多個(gè)并發(fā)實(shí)驗(yàn)都可以保證具備一定流量的并行進(jìn)行

  • 假設(shè)檢驗(yàn)流程

    • 建立假設(shè)(常將沒(méi)有充分理由不能否定的命題作為原假設(shè))
    • 選擇檢驗(yàn)統(tǒng)計(jì)量
    • 選擇顯著性水平\alpha
    • 計(jì)算拒絕域或是計(jì)算P值
    • 得出結(jié)論
  • 假設(shè)檢驗(yàn)的原理:小概率原理

  • 兩類錯(cuò)誤:

    • 第一類錯(cuò)誤(拒真錯(cuò)誤习瑰、顯著性水平):H_0為真,但是由于隨機(jī)性济蝉,統(tǒng)計(jì)檢驗(yàn)量落在了拒絕域內(nèi)
    • 第二類錯(cuò)誤(取偽錯(cuò)誤):H_0為假杰刽,但是由于隨機(jī)性,統(tǒng)計(jì)檢驗(yàn)量落在了接收域內(nèi)王滤。
    • 兩者的大小是相對(duì)的贺嫂,一個(gè)減小勢(shì)必導(dǎo)致另一個(gè)增加。所以要在適當(dāng)控制拒真錯(cuò)誤中制約取偽錯(cuò)誤雁乡。
  • 檢驗(yàn)P值:

    利用樣本觀測(cè)值能夠做出拒絕原假設(shè)的最小顯著性水平稱為檢驗(yàn)P值
  • 勢(shì)函數(shù)或者功效函數(shù)

    樣本觀測(cè)值落在拒絕域內(nèi)的概率稱為該檢驗(yàn)的勢(shì)函數(shù)第喳。

  • 假設(shè)檢驗(yàn)的分類

    • 單個(gè)正態(tài)總體均值的檢驗(yàn)
      • 方差已知時(shí)的檢驗(yàn)

        微信截圖_20190909225442.png
      • 方差未知時(shí)的檢驗(yàn)

        微信截圖_20190909225459.png

    兩個(gè)正態(tài)總體均值差的檢驗(yàn)

    • 方差已知的檢驗(yàn)
微信截圖_20190909225542.png
  • 方差相等但是未知的檢驗(yàn)
微信截圖_20190909225554.png
  • 單個(gè)正態(tài)總體方差的卡方檢驗(yàn)

    微信截圖_20190909225913.png
微信截圖_20190909225925.png
  • 兩個(gè)正態(tài)總體方差的F檢驗(yàn)
![微信截圖_20190909230021.png](https://upload-images.jianshu.io/upload_images/10558298-676c219f09da36e8.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市踱稍,隨后出現(xiàn)的幾起案子曲饱,更是在濱河造成了極大的恐慌,老刑警劉巖珠月,帶你破解...
    沈念sama閱讀 221,695評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件扩淀,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡啤挎,警方通過(guò)查閱死者的電腦和手機(jī)驻谆,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,569評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)庆聘,“玉大人胜臊,你說(shuō)我怎么就攤上這事』锱校” “怎么了象对?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,130評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)宴抚。 經(jīng)常有香客問(wèn)我勒魔,道長(zhǎng)甫煞,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,648評(píng)論 1 297
  • 正文 為了忘掉前任沥邻,我火速辦了婚禮危虱,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘唐全。我一直安慰自己埃跷,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,655評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布邮利。 她就那樣靜靜地躺著弥雹,像睡著了一般。 火紅的嫁衣襯著肌膚如雪延届。 梳的紋絲不亂的頭發(fā)上剪勿,一...
    開(kāi)封第一講書(shū)人閱讀 52,268評(píng)論 1 309
  • 那天,我揣著相機(jī)與錄音方庭,去河邊找鬼厕吉。 笑死,一個(gè)胖子當(dāng)著我的面吹牛械念,可吹牛的內(nèi)容都是我干的头朱。 我是一名探鬼主播,決...
    沈念sama閱讀 40,835評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼龄减,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼项钮!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起希停,我...
    開(kāi)封第一講書(shū)人閱讀 39,740評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤烁巫,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后宠能,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體亚隙,經(jīng)...
    沈念sama閱讀 46,286評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,375評(píng)論 3 340
  • 正文 我和宋清朗相戀三年违崇,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了阿弃。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,505評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡亦歉,死狀恐怖恤浪,靈堂內(nèi)的尸體忽然破棺而出畅哑,到底是詐尸還是另有隱情肴楷,我是刑警寧澤,帶...
    沈念sama閱讀 36,185評(píng)論 5 350
  • 正文 年R本政府宣布荠呐,位于F島的核電站赛蔫,受9級(jí)特大地震影響砂客,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜呵恢,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,873評(píng)論 3 333
  • 文/蒙蒙 一鞠值、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧渗钉,春花似錦彤恶、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,357評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至瘫怜,卻和暖如春术徊,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背鲸湃。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,466評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工赠涮, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人暗挑。 一個(gè)月前我還...
    沈念sama閱讀 48,921評(píng)論 3 376
  • 正文 我出身青樓笋除,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親窿祥。 傳聞我的和親對(duì)象是個(gè)殘疾皇子株憾,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,515評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容

  • https://mp.weixin.qq.com/s/BuHiG9FjX-OiSNWx3KquQQ 17.隨機(jī)梯度...
    _龍雀閱讀 3,779評(píng)論 0 4
  • SQL題: 表 Cost: date | cname(customer's name) | cost找出每天花費(fèi)最...
    無(wú)敵的肉包閱讀 10,273評(píng)論 0 41
  • 1、問(wèn):你在測(cè)試中發(fā)現(xiàn)了一個(gè)bug晒衩,但是開(kāi)發(fā)經(jīng)理認(rèn)為這不是一個(gè)bug嗤瞎,你應(yīng)該怎樣解決? 首先听系,將問(wèn)題提交到缺陷管理...
    小灰輝先生閱讀 1,337評(píng)論 0 3
  • 包含的重點(diǎn)內(nèi)容:JAVA基礎(chǔ)JVM 知識(shí)開(kāi)源框架知識(shí)操作系統(tǒng)多線程TCP 與 HTTP架構(gòu)設(shè)計(jì)與分布式算法數(shù)據(jù)庫(kù)知...
    消失er閱讀 4,333評(píng)論 1 10
  • 1****贝奇、問(wèn):你在測(cè)試中發(fā)現(xiàn)了一個(gè)bug****,但是開(kāi)發(fā)經(jīng)理認(rèn)為這不是一個(gè)bug****靠胜,你應(yīng)該怎樣解決掉瞳?首先...
    一箭閱讀 9,079評(píng)論 1 205