1.6 全概率公式與Bayes公式

1.6 全概率公式與Bayes公式

例:一所學(xué)校里面有 60% 的男生,40% 的女生缩搅。男生總是穿長(zhǎng)褲溉知,女生則一半穿長(zhǎng)褲一半穿裙子。有了這些信息之后我們可以容易地計(jì)算“隨機(jī)選取一個(gè)學(xué)生刃宵,他(她)穿長(zhǎng)褲的概率和穿裙子的概率是多大”,這個(gè)就是前面說(shuō)的“正向概率”的計(jì)算捅彻。然而组去,假設(shè)你走在校園中,迎面走來(lái)一個(gè)穿長(zhǎng)褲的學(xué)生(很不幸的是你高度近似步淹,你只看得見(jiàn)他(她)穿的是否長(zhǎng)褲,而無(wú)法確定他(她)的性別)诚撵,你能夠推斷出他(她)是男生的概率是多大嗎缭裆?


全概率公式

例:設(shè)女性患某種疾病的概率為0.3,男性患該病的概率為0.25寿烟,已知全國(guó)的男女比例為40:42?澈驼,求任何一人患該病的概率。

分析:記事件A為患該疾病筛武,事件B_1為女性患該病缝其,事件B_2為男性患該病挎塌,則
\begin{aligned} P(A)&=P(AB_1)+P(AB_2)=P(A|B_1)P(B_1)+P(A|B_2)P(B_2)\\ &=0.3\cdot\frac{40}{82}+0.25\cdot\frac{42}{82} \approx 0.274 \end{aligned}

全概率公式

定理:設(shè)\Omega為樣本空間,若事件B_1,B_2,...,B_n滿足

  1. B_1,B_2,...,B_n互不相容内边,即
    B _ { i } B _ { j } = \Phi \quad ( i \neq j , i , i , j = 1,2 , \cdots , n )
  2. B _ { 1 } \cup B _ { 2 } \cup \cdots \cup B _ { n } = \Omega

則稱\{B_1,B_2,...,B_n\}為樣本空間\Omega的一個(gè)分劃榴都,進(jìn)而可得
\begin{aligned} P ( A ) & = P \left( A B _ { 1 } \cup A B _ { 2 } \cup \cdots \cup A B _ { n } \right) \\ & = P \left( A B _ { 1 } \right) + P \left( A B _ { 2 } \right) + \cdots + P \left( A B _ { n } \right) \\ & = P ( A | B _ { 1 } ) P \left( B _ { 1 } \right) + P ( A | B _ { 2 } ) P \left( B _ { 2 } \right) + \cdots + P ( A | B _ { n } ) P \left( B _ { n } \right) \end{aligned}
也即
P ( A ) = \sum _ { i = 1 } ^ { n } P ( A | B _ { i } ) P \left( B _ { i } \right)
該公式稱為全概率公式(Law of Total Probability)


例:袋中有a只紅球b只白球,先從袋中任取一球漠其,記下顏色后放回嘴高,同時(shí)向袋中放入同顏色的球1?只,然后再?gòu)拇腥〕鲆磺蚝褪骸G蟮诙稳〉桨浊虻母怕省?/p>

解:記A=\{\text{第二次取到白球}\},B_1=\{\text{第一次取到白球}\},B_2=\{\text{第一次取到紅球}\}拴驮,顯然B_1,B_2\Omega的一個(gè)分劃,由全概率公式有
\begin{aligned} P ( A ) & = P ( A | B _ { 1 } ) P \left( B _ { 1 } \right) + P ( A | B _ { 2 } ) P \left( B _ { 2 } \right) \\ & = \frac { b + 1 } { a + b + 1 } \cdot \frac { b } { a + b } + \frac { b } { a + b + 1 } \cdot \frac { a } { a + b } \\ & = \frac { b } { a + b } \end{aligned}

思考:若第2次向袋中放入同顏色的球c?只柴信,結(jié)果如何套啤?
答:結(jié)果不變


例:有10個(gè)袋,其中甲袋二個(gè),每袋中有紅球、白球各2個(gè);乙袋三個(gè),每袋中有紅球3個(gè)随常、白球2個(gè);丙袋五個(gè),每袋中有紅球2個(gè)纲岭、白球3個(gè).從十個(gè)袋中任取一袋,再?gòu)拇腥稳∫磺?求取到白球的概率.

解:記B_1,B_2,B_3分別表示取到甲、乙线罕、丙袋止潮,A表示取到白球。由全概率公式
\begin{aligned} P ( A ) & = \sum _ { i = 1 } ^ { 3 } P ( A | B _ { i } ) P \left( B _ { i } \right) \\ & = \frac { 2 } { 10 } \cdot \frac { 2 } { 4 } + \frac { 3 } { 10 } \cdot \frac { 2 } { 5 } + \frac { 5 } { 10 } \cdot \frac { 3 } { 5 } = \frac { 13 } { 25 } \end{aligned}

問(wèn):如果將三個(gè)袋中的球混合在一起钞楼,然后任取一球喇闸,問(wèn)取到白球的概率是否一樣?
答:不同询件!全概率公式是概率的加權(quán)平均燃乍。


例:甲、乙兩坦克的首發(fā)命中率均為0.8,經(jīng)修正后的第二發(fā)命中率均為0.9, 敵目標(biāo)被一發(fā)炮彈擊中而被擊毀的概率為0.2,被兩發(fā)炮彈擊中而擊毀的概率為0.5,被三發(fā)炮彈擊中必定被擊毀. 在戰(zhàn)斗中,甲宛琅、乙兩坦克分別向敵同一目標(biāo)發(fā)射了兩發(fā)炮彈,求敵目標(biāo)被擊毀的概率.

解:設(shè)A表示目標(biāo)被擊毀刻蟹,B_i表示目標(biāo)被i發(fā)炮彈擊中,i=1,2,3,4嘿辟。
\begin{array} { l } { P \left( B _ { 1 } \right) = 2 ( 0.8 \times 0.2 \times 0.05 \times 0.05 + 0.2 \times 0.2 \times 0.95 \times 0.05 ) = 0.0046 } \\ { P \left( B _ { 2 } \right) = 0.8 \times 0.8 \times 0.05 \times 0.05 + 0.2 \times 0.2 \times 0.95 \times 0.95 } \\ {\quad\quad\quad\quad +4 \times 0.8 \times 0.2 \times 0.95 \times 0.05 = 0.0681 } \\ { P \left( B _ { 3 } \right) = 2 ( 0.8 \times 0.8 \times 0.95 \times 0.05 + 0.8 \times 0.2 \times 0.95 \times 0.95 ) = 0.3496 } \\ { P \left( B _ { 4 } \right) = 0.8 \times 0.8 \times 0.95 \times 0.95 = 0.5776 } \end{array}
由全概率公式
\begin{aligned} P ( A ) & = \sum _ { i = 0 } ^ { 4 } P ( A | B _ { i } ) P \left( B _ { i } \right) \\ & = 0 . .2 \times 0.0046 + 0.5 \times 0.0681 + 1 \times 0.3496 + 1 \times 0.5776 \\ & = 0.96217 \end{aligned}


Bayes公式(Bayes's Theorem)

事件之間的聯(lián)系

設(shè)\left\{ B _ { 1 } , B _ { 2 } , \cdots , B _ { n } \right\}為樣本空間的一個(gè)分劃舆瘪,且
P ( A ) > 0 , P \left( B _ { i } \right) > 0 \quad ( i = 1,2 , \cdots , n )
則由乘法公式
P \left( B _ { i } | A \right) P ( A ) = P ( A | B _ { i } ) P \left( B _ { i } \right) ( i = 1,2 , \cdots , n )
結(jié)合全概率公式P ( A ) = \sum _ { j = 1 } ^ { n } P ( A | B _ { j } ) P \left( B _ { j } \right),可以得到
P \left( B _ { i } | A \right) = \frac { P ( A | B _ { i } ) P \left( B _ { i } \right) } { \sum _ { j = 1 } ^ { n } P ( A | B _ { j } ) P \left( B _ { j } \right) } ( i = 1,2 , \cdots , n )
該公式稱為Bayes公式

Bayes公式

Bayes公式體現(xiàn)了一種“因”和“果”的聯(lián)系红伦,很多時(shí)候不僅可以由因推果英古,也可以由果推因。

通常昙读,事件A在事件B已發(fā)生的條件下發(fā)生的概率召调,與事件B在事件A已發(fā)生的條件下發(fā)生的概率是不一樣的。然而,這兩者是有確定的關(guān)系的唠叛,Bayes公式就是這種關(guān)系的陳述只嚣。
P(B_j|A)P(B_j)有時(shí)被稱作標(biāo)準(zhǔn)似然度(standardised likelihood),這樣一來(lái)Bayes定理可表述為:后驗(yàn)概率=標(biāo)準(zhǔn)似然度*先驗(yàn)概率

所謂的Bayes方法源于Tomas Bayes生前為解決一個(gè)“逆概”問(wèn)題寫(xiě)的一篇文章艺沼,而這篇文章是在他死后才由他的一位朋友發(fā)表出來(lái)的册舞。在Bayes寫(xiě)這篇文章之前,人們已經(jīng)能夠計(jì)算“正向概率”澳厢,如“假設(shè)袋子里面有N個(gè)白球环础,M個(gè)黑球,你伸手進(jìn)去摸一把剩拢,摸出黑球的概率是多大”线得。而一個(gè)自然而然的問(wèn)題是反過(guò)來(lái):“如果我們事先并不知道袋子里面黑白球的比例,而是閉著眼睛摸出一個(gè)(或好幾個(gè))球徐伐,觀察這些取出來(lái)的球的顏色之后贯钩,那么我們可以就此對(duì)袋子里面的黑白球的比例作出什么樣的推測(cè)”。這個(gè)問(wèn)題办素,就是所謂的逆概問(wèn)題角雷。

實(shí)際上,Bayes當(dāng)時(shí)的論文只是對(duì)這個(gè)問(wèn)題的一個(gè)直接的求解嘗試性穿,并不清楚他當(dāng)時(shí)是不是已經(jīng)意識(shí)到這里面包含著的深刻的思想勺三。然而后來(lái),Bayes方法席卷了概率論需曾,并將應(yīng)用延伸到各個(gè)問(wèn)題領(lǐng)域吗坚,所有需要作出概率預(yù)測(cè)的地方都可以見(jiàn)到Bayes方法的影子,特別地呆万,Bayes是機(jī)器學(xué)習(xí)的核心方法之一商源。這背后的深刻原因在于,現(xiàn)實(shí)世界本身就是不確定的谋减,人類(lèi)的觀察能力是有局限性的(否則有很大一部分科學(xué)就沒(méi)有必要做了——設(shè)想我們能夠直接觀察到電子的運(yùn)行牡彻,還需要對(duì)原子模型爭(zhēng)吵不休嗎?)出爹,我們?nèi)粘K^察到的只是事物表面上的結(jié)果庄吼,沿用剛才那個(gè)袋子里面取球的比方,我們往往只能知道從里面取出來(lái)的球是什么顏色以政,而并不能直接看到袋子里面實(shí)際的情況霸褒。


例(吸毒檢測(cè)):假設(shè)一個(gè)常規(guī)的檢測(cè)結(jié)果的敏感度與可靠度均為99\%,即吸毒者每次檢測(cè)呈陽(yáng)性(+)的概率為99\%盈蛮。而不吸毒者每次檢測(cè)呈陰性(-)的概率為99\%。從檢測(cè)結(jié)果的概率來(lái)看技矮,檢測(cè)結(jié)果是比較準(zhǔn)確的抖誉,但是Bayes定理卻可以揭示一個(gè)潛在的問(wèn)題殊轴。假設(shè)某公司對(duì)全體雇員進(jìn)行吸毒檢測(cè),已知0.5\%的雇員吸毒袒炉。請(qǐng)問(wèn)每位檢測(cè)結(jié)果呈陽(yáng)性的雇員吸毒的概率有多高旁理?

分析:令D為雇員吸毒事件,N為雇員不吸毒事件我磁,+為檢測(cè)呈陽(yáng)性事件孽文。可得

  • P(D)代表雇員吸毒的概率夺艰,不考慮其他情況芋哭,該值為0.005。因?yàn)楣镜念A(yù)先統(tǒng)計(jì)表明該公司的雇員中有0.5\%的人吸食毒品郁副,所以這個(gè)值就是D的先驗(yàn)概率减牺。
  • P(N)?代表雇員不吸毒的概率,顯然存谎,該值為0.995?拔疚,也就是1-P(D)?
  • P(+|D)?代表吸毒者陽(yáng)性檢出率既荚,這是一個(gè)條件概率稚失,由于陽(yáng)性檢測(cè)準(zhǔn)確性是99\%?,因此該值為0.99?恰聘。
  • P(+|N)代表不吸毒者陽(yáng)性檢出率句各,也就是出錯(cuò)檢測(cè)的概率,該值為0.01憨琳,因?yàn)閷?duì)于不吸毒者诫钓,其檢測(cè)為陰性的概率為99\%,因此篙螟,其被誤檢測(cè)成陽(yáng)性的概率為1 - 0.99 = 0.01菌湃。
  • P(+)代表不考慮其他因素的影響的陽(yáng)性檢出率。該值為0.0149或者1.49\%遍略。具體由全概率公式計(jì)算得到:此概率 = 吸毒者陽(yáng)性檢出率(0.5\% \times 99\% = 0.495\%)+ 不吸毒者陽(yáng)性檢出率(99.5\% \times 1\% = 0.995\%)惧所。P(+)=0.0149?是檢測(cè)呈陽(yáng)性的先驗(yàn)概率。用數(shù)學(xué)公式描述為:
    P(+)=P(+ \cap D)+P(+\cap N)=P(+| D) P(D)+P(+| N) P(N)

根據(jù)上述描述绪杏,我們可以計(jì)算某人檢測(cè)呈陽(yáng)性時(shí)確實(shí)吸毒的條件概率P(D|+)
\begin{aligned} P(D |+) &=\frac{ P(+| D) P(D)}{P(+)} \\ &=\frac{P(+| D) P(D)}{P(+| D) P(D)+P(+| N) P(N)} \\ &=\frac{0.99 \times 0.005}{0.99 \times 0.005+0.01 \times 0.995} \\ &=0.3322 \end{aligned}
結(jié)論:盡管吸毒檢測(cè)的準(zhǔn)確率高達(dá)99%下愈,但Bayes定理告訴我們:如果某人檢測(cè)呈陽(yáng)性,其吸毒的概率只有大約33%蕾久,不吸毒的可能性比較大势似。假陽(yáng)性高,則檢測(cè)的結(jié)果不可靠。

類(lèi)似的情況:

  • 胰腺癌檢測(cè):即使100%的胰腺癌癥患者都有某癥狀履因,而某人有同樣的癥狀障簿,絕對(duì)不代表該人有100%的概率得胰腺癌,還需要考慮先驗(yàn)概率栅迄,假設(shè)胰腺癌的發(fā)病率是十萬(wàn)分之一站故,而全球有同樣癥狀的人有萬(wàn)分之一,則此人得胰腺癌的概率只有十分之一毅舆,90%的可能是是假陽(yáng)性
  • 不良種子檢測(cè):假設(shè)100%的不良種子都表現(xiàn)A性狀西篓,而種子表現(xiàn)A性狀,并不代表此種子100%是不良種子憋活,還需要考慮先驗(yàn)概率岂津,假設(shè)一共有6萬(wàn)顆不良種子,在種子中的比例是十萬(wàn)分之一(假設(shè)總共有60億顆種子)余掖,假設(shè)所有種子中有1/3表現(xiàn)A性狀(即20億顆種子表現(xiàn)A性狀)寸爆,則此種子為不良種子的概率只有十萬(wàn)分之三

例:某工廠的一、二盐欺、三車(chē)間都生產(chǎn)同一產(chǎn)品赁豆,產(chǎn)量分別占總產(chǎn)量的15%,80%,5%三個(gè)車(chē)間的次品率分別為2%,1%,3%.現(xiàn)從匯總起來(lái)的產(chǎn)品中任取一個(gè),經(jīng)檢查是次品,判斷該次品是哪個(gè)車(chē)間生產(chǎn)的可能性較大?

分析:這是“因—果”分析問(wèn)題冗美,故應(yīng)用Bayes公式

解:記A表示取得次品魔种,B_i表示取到的產(chǎn)品是i車(chē)間生產(chǎn)的,i=1,2,3粉洼,由全概率公式
\begin{aligned} P ( A ) & = \sum _ { j = 1 } ^ { 3 } P ( A | B _ { j } ) P \left( B _ { j } \right) \\ & = 0.02 \times 0.15 + 0.01 \times 0.80 + 0.03 \times 0.05 = 0.0125 \end{aligned}
再由Bayes公式
\begin{array} { l } { P \left( B _ { 1 } | A \right) = \frac { P ( A | B _ { 1 } ) P \left( B _ { 1 } \right) } { P ( A ) } = \frac { 0.02 \times 0.15 } { 0.0125 } = 0.24 } \\ { P \left( B _ { 2 } | A \right) = \frac { 0.01 \times 0.80 } { 0.0125 } = 0.64 } \\ { P \left( B _ { 3 } | A \right) = \frac { 0.03 \times 0.05 } { 0.0125 } = 0.12 } \end{array}
可見(jiàn)該次品是第二車(chē)間生產(chǎn)的可能性較大节预。

以上的分析過(guò)程也被稱為Bayes推斷


Bayes推斷

假定B _ { 1 } , B _ { 2 } , \cdots , B _ { n }為導(dǎo)致試驗(yàn)結(jié)果的“原因”属韧,稱P \left( B _ { i } \right) ( i = 1,2 , \cdots , n )先驗(yàn)概率安拟。

若試驗(yàn)產(chǎn)生事件A,則要探討事件發(fā)生的“原因”宵喂,稱P(B_i|A)后驗(yàn)概率糠赦,稱P(A|B_i)原因概率

  • 先驗(yàn)概率反映了各種“原因”發(fā)生的可能性大小
  • 先驗(yàn)概率和原因概率可以在試驗(yàn)前分析確定
  • 后驗(yàn)概率反映了試驗(yàn)后對(duì)各種“原因”發(fā)生的可能性大小的推斷.后驗(yàn)概率可通過(guò)Bayes公式進(jìn)行計(jì)算
  • Bayes 方法廣泛應(yīng)用于網(wǎng)絡(luò)、分類(lèi)锅棕、診斷拙泽、估計(jì)、檢驗(yàn)裸燎、判別顾瞻、推理等方面

例:假定B _ { 1 } , B _ { 2 } , \cdots , B _ { n }為各種疾病,應(yīng)用統(tǒng)計(jì)方法可確定患病的概率(先驗(yàn)概率)
P \left( B _ { i } \right) \quad ( i = 1,2 , \cdots , n )
應(yīng)用醫(yī)學(xué)知識(shí)確定每種疾病下指標(biāo)A(例如體溫德绿、脈搏荷荤、血象等)出現(xiàn)的概率(原因概率)退渗,應(yīng)用Bayes公式,可以計(jì)算出該指標(biāo)意味著某種疾病的概率(后驗(yàn)概率)
P \left( B _ { i } | A \right) \quad ( i = 1,2 , \cdots , n )
這正是大數(shù)據(jù)在醫(yī)療系統(tǒng)中應(yīng)用的原理梅猿。


課后思考題:習(xí)題一:20氓辣,21秒裕,22袱蚓,23,24


參見(jiàn)數(shù)學(xué)之美番外篇:平凡而又神奇的貝葉斯方法

Bayes公式與人工智能

例(拼寫(xiě)糾正

經(jīng)典著作《人工智能:現(xiàn)代方法》的作者之一 Peter Norvig 曾經(jīng)寫(xiě)過(guò)一篇介紹如何寫(xiě)一個(gè)拼寫(xiě)檢查/糾正器的文章(原文在這里几蜻,這篇文章很深入淺出喇潘,強(qiáng)烈建議讀一讀),里面用到的就是Bayes方法梭稚。

首先颖低,我們的問(wèn)題是我們看到用戶輸入了一個(gè)不在字典中的單詞,我們需要去猜測(cè):“這個(gè)家伙到底真正想輸入的單詞是什么呢弧烤?”用剛才我們形式化的語(yǔ)言來(lái)敘述就是忱屑,我們需要求:
P(\text{我們猜測(cè)他想輸入的單詞} | \text{他實(shí)際輸入的單詞})
這個(gè)概率,并找出那個(gè)使得這個(gè)概率最大的猜測(cè)單詞暇昂。

顯然莺戒,我們的猜測(cè)未必是唯一的。比如用戶輸入: thew 急波,那么他到底是想輸入 the 从铲,還是想輸入 thaw ?到底哪個(gè)猜測(cè)可能性更大呢澄暮?幸運(yùn)的是我們可以用Bayes公式來(lái)直接算出它們各自的概率名段,我們不妨將我們的多個(gè)猜測(cè)記為 h_1, h2,...h 代表 hypothesis),它們都屬于一個(gè)有限且離散的猜測(cè)空間 H (單詞總共就那么多而已)泣懊,將用戶實(shí)際輸入的單詞記為 DD 代表 Data 伸辟,即觀測(cè)數(shù)據(jù)),于是P(\text{我們的猜測(cè)1 }| \text{他實(shí)際輸入的單詞})可以抽象地記為:P(h_1 | D)馍刮,類(lèi)似地信夫,對(duì)于我們的猜測(cè)2,則是 P(h_2 | D)渠退。不妨統(tǒng)一記為:
P(h | D)
運(yùn)用一次Bayes公式忙迁,我們得到:
P(h | D) = \frac{P(h) \times P(D | h)}{ P(D)}
對(duì)于不同的具體猜測(cè) h_1, h_2, h_3,…P(D) 都是一樣的碎乃,所以在比較 P(h_1 | D)P(h_2 | D) 的時(shí)候我們可以忽略這個(gè)常數(shù)姊扔。即我們只需要知道:
P(h | D) ∝ P(h) \times P(D | h)
這個(gè)式子的抽象含義是:對(duì)于給定觀測(cè)數(shù)據(jù),一個(gè)猜測(cè)是好是壞梅誓,取決于“這個(gè)猜測(cè)本身獨(dú)立的可能性大星∩摇(先驗(yàn)概率佛南,Prior )”和“這個(gè)猜測(cè)生成我們觀測(cè)到的數(shù)據(jù)的可能性大小”(似然,Likelihood )的乘積嵌言。具體到我們的那個(gè) thew 例子上嗅回,含義就是,用戶實(shí)際是想輸入 the 的可能性大小取決于 the 本身在詞匯表中被使用的可能性(頻繁程度)大写蒈睢(先驗(yàn)概率)和 想打 the 卻打成 thew 的可能性大忻嘣亍(似然)的乘積。

下面的事情就很簡(jiǎn)單了苛白,對(duì)于我們猜測(cè)為可能的每個(gè)單詞計(jì)算一下P(h) \times P(D | h) 這個(gè)值娃豹,然后取最大的,得到的就是最靠譜的猜測(cè)购裙。

類(lèi)似的方法可以用來(lái)處理自然語(yǔ)言的二義性問(wèn)題懂版,例如

The girl saw the boy with a telescope.

到底是 The girl saw-with-a-telescope the boy 這一語(yǔ)法結(jié)構(gòu),還是 The girl saw the-boy-with-a-telescope 呢躏率??jī)煞N語(yǔ)法結(jié)構(gòu)的常見(jiàn)程度都差不多(你可能會(huì)覺(jué)得后一種語(yǔ)法結(jié)構(gòu)的常見(jiàn)程度較低躯畴,這是事后偏見(jiàn),你只需想想 The girl saw the boy with a book 就知道了薇芝。當(dāng)然蓬抄,實(shí)際上從大規(guī)模語(yǔ)料統(tǒng)計(jì)結(jié)果來(lái)看后一種語(yǔ)法結(jié)構(gòu)的確稍稍不常見(jiàn)一丁點(diǎn),但是絕對(duì)不足以解釋我們對(duì)第一種結(jié)構(gòu)的強(qiáng)烈傾向)恩掷。那么到底為什么呢倡鲸?

比價(jià)合理的解釋是:如果語(yǔ)法結(jié)構(gòu)是 The girl saw the-boy-with-a-telecope 的話,怎么那個(gè)男孩偏偏手里拿的就是望遠(yuǎn)鏡——一個(gè)可以被用來(lái) saw-with 的東東捏黄娘?這也忒小概率了吧峭状。他咋就不會(huì)拿本書(shū)呢?拿什么都好逼争。怎么偏偏就拿了望遠(yuǎn)鏡优床?所以唯一的解釋是,這個(gè)“巧合”背后肯定有它的必然性,這個(gè)必然性就是,如果我們將語(yǔ)法結(jié)構(gòu)解釋為 The girl saw-with-a-telescope the boy 的話旁振,就跟數(shù)據(jù)完美吻合了——既然那個(gè)女孩是用某個(gè)東西去看這個(gè)男孩的,那么這個(gè)東西是一個(gè)望遠(yuǎn)鏡就完全可以解釋了(不再是小概率事件了)移层。

還有中文分詞的問(wèn)題,比如

給定一個(gè)句子(字串)赫粥,如:

南京市長(zhǎng)江大橋

如何對(duì)這個(gè)句子進(jìn)行分詞(詞串)才是最靠譜的观话。例如:

  1. 南京市/長(zhǎng)江大橋

  2. 南京/市長(zhǎng)/江大橋

這兩個(gè)分詞,到底哪個(gè)更靠譜呢越平?

顯然這個(gè)思想還可以推廣到機(jī)器翻譯的領(lǐng)域频蛔,甚至是圖像識(shí)別灵迫、垃圾郵件過(guò)濾

圖像識(shí)別中的Bayes方法
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市晦溪,隨后出現(xiàn)的幾起案子瀑粥,更是在濱河造成了極大的恐慌,老刑警劉巖三圆,帶你破解...
    沈念sama閱讀 218,451評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件狞换,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡嫌术,警方通過(guò)查閱死者的電腦和手機(jī)哀澈,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,172評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)度气,“玉大人,你說(shuō)我怎么就攤上這事膨报×准” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,782評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵现柠,是天一觀的道長(zhǎng)院领。 經(jīng)常有香客問(wèn)我,道長(zhǎng)够吩,這世上最難降的妖魔是什么比然? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,709評(píng)論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮周循,結(jié)果婚禮上强法,老公的妹妹穿的比我還像新娘。我一直安慰自己湾笛,他們只是感情好饮怯,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,733評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著嚎研,像睡著了一般蓖墅。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上临扮,一...
    開(kāi)封第一講書(shū)人閱讀 51,578評(píng)論 1 305
  • 那天论矾,我揣著相機(jī)與錄音,去河邊找鬼杆勇。 笑死贪壳,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的靶橱。 我是一名探鬼主播寥袭,決...
    沈念sama閱讀 40,320評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼路捧,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了传黄?” 一聲冷哼從身側(cè)響起杰扫,我...
    開(kāi)封第一講書(shū)人閱讀 39,241評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎膘掰,沒(méi)想到半個(gè)月后章姓,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,686評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡识埋,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,878評(píng)論 3 336
  • 正文 我和宋清朗相戀三年凡伊,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片窒舟。...
    茶點(diǎn)故事閱讀 39,992評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡系忙,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出惠豺,到底是詐尸還是另有隱情银还,我是刑警寧澤,帶...
    沈念sama閱讀 35,715評(píng)論 5 346
  • 正文 年R本政府宣布洁墙,位于F島的核電站蛹疯,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏热监。R本人自食惡果不足惜捺弦,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,336評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望孝扛。 院中可真熱鬧列吼,春花似錦、人聲如沸疗琉。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,912評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)盈简。三九已至凑耻,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間柠贤,已是汗流浹背香浩。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,040評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留臼勉,地道東北人邻吭。 一個(gè)月前我還...
    沈念sama閱讀 48,173評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像宴霸,于是被迫代替她去往敵國(guó)和親囱晴。 傳聞我的和親對(duì)象是個(gè)殘疾皇子膏蚓,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,947評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 今天是星期天,沒(méi)撈著偷懶畸写,七點(diǎn)就起床了驮瞧,吃過(guò)飯,閨女就著急去輔導(dǎo)班枯芬,說(shuō)寒假后的第一次上課可不能遲到了论笔,要給老...
    一米陽(yáng)光shi閱讀 232評(píng)論 3 6
  • 與妻、兒說(shuō)了多次的回鄉(xiāng)捉蟹之行千所,終于在金秋十月(農(nóng)歷八月)成行了狂魔。 說(shuō)是回故鄉(xiāng),其實(shí)離現(xiàn)在住的縣城也就十公里路淫痰,坐...
    閑文志閱讀 428評(píng)論 1 1
  • 今日體驗(yàn)最楷,今天上班把奔馳車(chē)給梳理一下,給客戶打了個(gè)電話黑界,說(shuō)一下當(dāng)下車(chē)的情況管嬉,對(duì)于手中的在廠車(chē)輛必須全程管控,讓客戶...
    王全峰閱讀 86評(píng)論 0 0
  • 俗話說(shuō)“出名要趁早”朗鸠,在我看來(lái),成功要趁早础倍。 出名趁早不一定是好事烛占,有可能有才華卻被榮譽(yù)沖昏了頭,比如年輕的仲永沟启,...
    藍(lán)雪花a閱讀 4,346評(píng)論 0 1
  • 天還未亮的馬路忆家,四下無(wú)人, 你站在空蕩蕩的十字路口德迹, 說(shuō)拍一張躲得過(guò)對(duì)酒當(dāng)歌的夜芽卿。 卻躲不過(guò)四下無(wú)人的街的應(yīng)景照片...
    陽(yáng)光上來(lái)閱讀 148評(píng)論 0 1