機器學(xué)習(xí)算法A會看資料D和假設(shè)集合H贝或,然后在H里面選一個g∥阶牛現(xiàn)在我們來看機器是如何處理是非題泼诱。(二分類)
What hypothesis can we use?
那么我們的來看一個模型,看看這個H長什么樣赊锚。
x = (x1,x2,...,xd)治筒,這些是features of customer屉栓, 乘上一個權(quán)重w,來計算score耸袜。
y:{+1(good)友多,-1(bad)}。
通過將右邊的threshold移到左邊就可以知道堤框,如果左邊項 > 0域滥,那么 y=1;如果左邊項 < 0胰锌,那么y=-1骗绕。這也可以用sign函數(shù)來表示藐窄。(這里如果左邊項 = 0资昧,其實這個不重要,y可以隨便等于1或者-1)
上面的這個公式叫做感知機Perceptron荆忍,h與w和threshold有關(guān)格带,不同的w與threshold取值就可以確定不同的h。(w是一個矩陣)
下面進行一個符號上的簡化刹枉。
具體來看一下h叽唱。
x:在平面上的點(這個點在d維空間里)
y:O(+1),X(-1)
h:lines(或者是在d維空間里的超平面)
h的一邊是預(yù)測成+1微宝,另一邊是預(yù)測成-1棺亭。
(問題:這里的h是H嗎?這里的d維空間或者d+1維空間需要分得很清楚嗎,因為前面剛才提到過x0和w0)
習(xí)題:
答案是2蟋软。+1代表的spam镶摘。如果想要很大的權(quán)重,說明這些單詞在spam里面經(jīng)常出現(xiàn)的岳守。