Perceptron Hypothesis Set
這一節(jié)中桐绒,林老師介紹了一種最為基本的假說模型:感知器模型夺脾。
先說背景問題:客戶申請(qǐng)信用卡,銀行想根據(jù)客戶的申請(qǐng)信息茉继,決定是否給客戶發(fā)放咧叭。
這時(shí)我們用一個(gè) n 維向量 x 表示客戶的信息,比如 x1=8000烁竭,表示該客戶月收入8000(需要統(tǒng)一量綱)菲茬。再用一個(gè) n 維向量 w 表示每個(gè)信息所代表的權(quán)重。這時(shí)派撕,我們用 x 和 w 的內(nèi)積表示某個(gè)客戶的得分婉弹。當(dāng)這個(gè)客戶的得分大于 Threshold 時(shí),就發(fā)放信用卡终吼,反之不發(fā)放镀赌。
然后我們得到這個(gè)假說函數(shù) h(x):
顯然,+1表示發(fā)放衔峰,-1表示不發(fā)放佩脊。接下來再對(duì)函數(shù)做如下處理:
這樣我們就得到了一個(gè)漂亮的 hypothesis。
那么垫卤,這樣一個(gè)表達(dá)式意味著什么呢威彰?我們?cè)賮砜匆粡垐D:
當(dāng)在向量 x 只有兩個(gè)維度時(shí),顯然它表示平面上的一條直線穴肘。平面上的點(diǎn)表示每個(gè)agent在平面上的位置歇盼,紅叉表示不發(fā)放亚再,圓圈表示發(fā)放木柬。直線就將這樣一個(gè)平面劃分成了兩塊沃斤。顯然惠昔,一個(gè)好的 hepothesis 是將data里發(fā)放和不發(fā)放兩個(gè)點(diǎn)切割到了不同的區(qū)域绽快。
不難推測(cè)葬项,當(dāng) x 有多個(gè)維度時(shí)掂咒,感知器函數(shù)是一個(gè)超平面腥寇,將多維空間中的點(diǎn)分割成兩部分侍匙。