數(shù)學(xué)基礎(chǔ)-均值估計

在我最近研究的stochastic bandit問題中,假設(shè)每個arm得到的reward是服從一個特定的分布,最后需要研究的regret函數(shù)與分布的均值相關(guān)穿撮,因此如何從目前得到的reward信息來估計真實(shí)的均值在這個研究中是一個很基本的問題。具體可以參見我之前的一篇文章[機(jī)器學(xué)習(xí)-bandit問題簡介]。當(dāng)然普遍來講谷异,對于均值的準(zhǔn)確有效估計是一個很基本的問題,在各種stochastic問題中都有它的身影锦聊。

在本篇文章中歹嘹,我們主要考慮n個獨(dú)立同分布的隨機(jī)變量的值與實(shí)際的均值μ之間的關(guān)系。

收斂性

首先是最著名的[中心極限定理, wikipedia]和[大數(shù)定律, wikipedia]孔庭,它們奠定了統(tǒng)計估計的基礎(chǔ)尺上。

中心極限定理, wikipedia
弱大數(shù)定律, wikipedia
強(qiáng)大數(shù)定律, wikipedia

這三個定理非常著名,本科的概率論課程都會講到圆到,它們奠定了了樣本均值最終會收斂到實(shí)際均值的理論基礎(chǔ)怎抛,有了這樣的理論保證,我們才可以用足夠多次的重復(fù)實(shí)驗(yàn)來估計實(shí)際均值芽淡。但是這三個定理更多地停留在理論層面上马绝,并沒有提到在“多少次”的重復(fù)之后,樣本均值可以“在什么程度上”逼近實(shí)際均值挣菲,對我們的實(shí)際應(yīng)用并不能產(chǎn)生具體的指導(dǎo)意義富稻。

估計的界

law of the iterated logarithm, wikipedia

在這個[重對數(shù)定律, wikipedia]的敘述中掷邦,要求隨機(jī)變量的均值為0,方差為1唉窃,但根據(jù)中心極限定理耙饰,可以很容易地將此定理拓展到一般的情況。從大數(shù)定律中我們得到Sn/n幾乎處處收斂為0纹份,依概率收斂為0苟跪,即Sn的界為o(n),而這個定理告訴我們Sn的階比√n要大蔓涧,即Sn/√n不收斂到0件已。

Markov's inequality, wikipedia

這個就是著名的[Markov不等式, wikipedia],它如此著名是因?yàn)槎ɡ肀旧韺﹄S機(jī)變量沒有太多的要求元暴,但又可以得到一個基本的估計篷扩,簡單地說,它如此著名就是因?yàn)樗糜密哉怠5窃诙ɡ碇幸箅S機(jī)變量是正的鉴未,拓展到一般情況,有它的一個著名推論[Chebyshev不等式, wikipedia]鸠姨。

Chebyshev‘s inequality, wikipedia

這三個定理在一定程度上都可以用來刻畫樣本均值和實(shí)際均值差的界限铜秆。但是第一個定理和收斂性中的討論一樣,同樣沒有告訴我們收斂程度和次數(shù)n之間的關(guān)系讶迁。而切比雪夫不等式的使用中涉及到方差连茧,但是很多時候我們是沒有方差的信息的,而且切比雪夫不等式給出的界略粗糙巍糯,有時候應(yīng)用乏力啸驯。

Chernoff-Hoeffding Bound

Chernoff-Hoeffding Bound, wikipedia

其中最后的結(jié)果交換樣本均值與實(shí)際均值的順序也成立。之所以用這個定理[wikipedia]做標(biāo)題實(shí)在是因?yàn)樗糜昧怂盥停趲缀跛衧tochastic bandit regret的估計中都能見到它的身影罚斗。原因就在于它不需要方差的信息,而且收斂的程度可以用n顯式表達(dá)宅楞,唯一的限制就是隨機(jī)變量的值是有界的惰聂,而在bandit問題中無界的reward是無法考慮的,所以自然滿足咱筛。

當(dāng)分布滿足一些額外的條件時,例如sub-Gaussion杆故,可以由凸分析得到一些其他的估計迅箩,這些下次再談。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末处铛,一起剝皮案震驚了整個濱河市饲趋,隨后出現(xiàn)的幾起案子拐揭,更是在濱河造成了極大的恐慌,老刑警劉巖奕塑,帶你破解...
    沈念sama閱讀 211,948評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件堂污,死亡現(xiàn)場離奇詭異,居然都是意外死亡龄砰,警方通過查閱死者的電腦和手機(jī)盟猖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,371評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來换棚,“玉大人式镐,你說我怎么就攤上這事」淘椋” “怎么了娘汞?”我有些...
    開封第一講書人閱讀 157,490評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長夕玩。 經(jīng)常有香客問我你弦,道長,這世上最難降的妖魔是什么燎孟? 我笑而不...
    開封第一講書人閱讀 56,521評論 1 284
  • 正文 為了忘掉前任禽作,我火速辦了婚禮,結(jié)果婚禮上缤弦,老公的妹妹穿的比我還像新娘领迈。我一直安慰自己,他們只是感情好碍沐,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,627評論 6 386
  • 文/花漫 我一把揭開白布狸捅。 她就那樣靜靜地躺著,像睡著了一般累提。 火紅的嫁衣襯著肌膚如雪尘喝。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,842評論 1 290
  • 那天斋陪,我揣著相機(jī)與錄音朽褪,去河邊找鬼。 笑死无虚,一個胖子當(dāng)著我的面吹牛缔赠,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播友题,決...
    沈念sama閱讀 38,997評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼嗤堰,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了度宦?” 一聲冷哼從身側(cè)響起踢匣,我...
    開封第一講書人閱讀 37,741評論 0 268
  • 序言:老撾萬榮一對情侶失蹤告匠,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后离唬,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體后专,經(jīng)...
    沈念sama閱讀 44,203評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,534評論 2 327
  • 正文 我和宋清朗相戀三年输莺,在試婚紗的時候發(fā)現(xiàn)自己被綠了戚哎。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,673評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡模闲,死狀恐怖建瘫,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情尸折,我是刑警寧澤啰脚,帶...
    沈念sama閱讀 34,339評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站实夹,受9級特大地震影響橄浓,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜亮航,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,955評論 3 313
  • 文/蒙蒙 一荸实、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧缴淋,春花似錦准给、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,770評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至钟沛,卻和暖如春畔规,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背恨统。 一陣腳步聲響...
    開封第一講書人閱讀 32,000評論 1 266
  • 我被黑心中介騙來泰國打工叁扫, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人畜埋。 一個月前我還...
    沈念sama閱讀 46,394評論 2 360
  • 正文 我出身青樓莫绣,卻偏偏與公主長得像,于是被迫代替她去往敵國和親悠鞍。 傳聞我的和親對象是個殘疾皇子对室,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,562評論 2 349

推薦閱讀更多精彩內(nèi)容

  • 2017年考研數(shù)學(xué)一大綱原文 考試科目:高等數(shù)學(xué)、線性代數(shù)、概率論與數(shù)理統(tǒng)計 考試形式和試卷結(jié)構(gòu) 一软驰、試卷滿分及考...
    SheBang_閱讀 620評論 0 7
  • 考試形式和試卷結(jié)構(gòu)一、試卷滿分及考試時間 試卷滿分為150分心肪,考試時間為180分鐘 二锭亏、答題方式 答題方式為閉卷、...
    幻無名閱讀 749評論 0 3
  • 作為前數(shù)學(xué)專業(yè)畢業(yè)生硬鞍,學(xué)過的概率統(tǒng)計知識已經(jīng)忘記得差不多了慧瘤,對于統(tǒng)計學(xué)的概念能清楚記得的也只有方差,標(biāo)準(zhǔn)差和均值了...
    Endzzz閱讀 18,897評論 2 140
  • 迷茫,拖拉伐坏,毫無目的怔匣;貪玩,懶惰桦沉,放縱自我每瞒。這似乎成了大多數(shù)年輕人的共性,可是纯露,你的未來怎么辦剿骨? 我們也許不是富二...
    三分先生6閱讀 903評論 0 0
  • Markdown簡介 Markdown 是一種輕量級標(biāo)記語言,它允許人們使用易讀易寫的純文本格式編寫文檔埠褪,然后轉(zhuǎn)換...
    ruifeng閱讀 284評論 0 0