概率派和樸素貝葉斯派
概率
推動(dòng)概率論
概率相比大家都學(xué)習(xí)過壳炎,但是大家可能還不知道概率背后是可重復(fù)性蔓榄。我們還是拿最簡單最經(jīng)典的示例,也就是投硬幣大家都知道只要我們做足夠多一次然后進(jìn)行統(tǒng)計(jì)就會(huì)發(fā)現(xiàn)出現(xiàn)正面和背面概率分別都是 50%
我好那么什么是可重復(fù)性,合適因?yàn)槿绻覀冞M(jìn)行多輪投幣測試,每輪測試 1000 次,發(fā)現(xiàn)每一輪下來正面和反面出現(xiàn)次數(shù)比例1比1局嘁,這就是概率的可重復(fù)性溉箕。如果沒有可重復(fù)性概率也就是沒有意義。
所以我們發(fā)現(xiàn)一些事物背后是一定穩(wěn)定性的東西(也就是模式)悦昵,這是我們機(jī)器學(xué)習(xí)基礎(chǔ)肴茄。
下面介紹一些概率出現(xiàn)術(shù)語和一些基本計(jì)算公式來幫助我們更好理解要機(jī)器學(xué)習(xí)。我們補(bǔ)充一些基礎(chǔ)知識(shí)都是為了機(jī)器學(xué)習(xí)
術(shù)語
- 實(shí)驗(yàn): 我們要研究內(nèi)容但指,例如投硬幣
- 事件: 試驗(yàn)的結(jié)果就是事件寡痰,也就是投硬幣后正面就是事件抗楔,用于 A B 大寫字母表示。事件是可以組合
- 概率空間:就是所有事件集合表示
概率運(yùn)算
-
:
-
:
這里兩個(gè)事件是獨(dú)立
-
:
-
:
推導(dǎo)貝葉斯公式
- P(A) 先驗(yàn)概率
- P(A|B) 后驗(yàn)概率
- B 證據(jù)
- A 事件
P(A) 什么都不知道我們對 A 事件發(fā)生概率估計(jì)拦坠,隨后得到 B 證據(jù)连躏,這樣有了證據(jù)就增加對 A 發(fā)生推斷后驗(yàn)概率 P(A|B)
貝葉斯公式的內(nèi)容(根據(jù)數(shù)據(jù)(證據(jù))更新對事件可能性的估計(jì))這就就是大數(shù)據(jù)被后支撐理論。
練習(xí)
三門問題(Monty Hall problem)亦稱為蒙提霍爾問題贞滨、蒙特霍問題或蒙提霍爾悖論入热,大致出自美國的電視游戲節(jié)目Let’s Make a Deal。
問題名字來自該節(jié)目的主持人蒙提·霍爾(Monty Hall)晓铆。參賽者會(huì)看見三扇關(guān)閉了的門勺良,其中一扇的后面有一輛汽車,選中后面有車的那扇門可贏得該汽車骄噪。當(dāng)參賽者選定了一扇門尚困,但未去開啟它的時(shí)候,節(jié)目主持人開啟剩下兩扇門的其中一扇链蕊,里面當(dāng)然沒有汽車事甜。主持人其后會(huì)問參賽者要不要換另一扇仍然關(guān)上的門。問題是:換另一扇門會(huì)否增加參賽者贏得汽車的機(jī)會(huì)示弓?
錯(cuò)誤答案
根據(jù)常識(shí)我們會(huì)認(rèn)為概率是 1/2
答案
那么答案是會(huì)讳侨。不換門的話,贏得汽車的幾率是1/3奏属。換門的話跨跨,贏得汽車的幾率是2/3。
推導(dǎo)
我們看一看本質(zhì)就是主持開門這個(gè)事件是不是影響到之前我們認(rèn)為 1/2 概率的事件囱皿。也就是我們之前提到證據(jù)勇婴。
我們用 三個(gè)事件分別表示 1 號(hào) 2 號(hào)和 3 號(hào)門有車事件概率,那么我們每一個(gè)事件概率都是
- 參加者選擇 1 號(hào)門
- 開門前的先驗(yàn)概率為
- 然后主持人開 3 號(hào)門嘱腥,主持人開門事件就是證據(jù), 用事件 B 來表示
- 如果 1 號(hào)門有車主持打開 3 號(hào)門概率是 1/2
- 如果 2 號(hào)門有車主持人打開 3 號(hào)門概率 1
- 如果 3 號(hào)門有車主持人打開 3 號(hào)門概率為 0