一、無監(jiān)督學習球昨、監(jiān)督學習和強化學習
監(jiān)督學習:在給定的一些數(shù)據(jù)下尔店,已經(jīng)告訴你這些數(shù)據(jù)的特性,并且讓你分類,然后給你一個數(shù)據(jù)讓你根據(jù)圖來推出其他的數(shù)據(jù)(給定一個坐標系嚣州,上面有相應的圖像鲫售,給你x數(shù)據(jù)讓你預測y的值)。如分類
無監(jiān)督學習:給你一組數(shù)據(jù)该肴,這些數(shù)據(jù)你并不知道分類是什么情竹,你需要根據(jù)結構自己劃分,并沒有標準答案沙庐。
無監(jiān)督學習應用:如聚類,
能將像素分類佳吞,對于計算機識別圖像很有用處拱雏,
將嘈雜的一對聲音經(jīng)過算法的處理,將聲音分離
文本處理
ICA算法用MATLAB一行代碼表示:
強化學習:給你一些正確的決策(強化學習的關鍵是定義什么是好行為什么是壞行為)底扳,通常每一次做了好行為就給他獎勵铸抑,壞行為就給相應的懲罰,漸漸地機器可以自動判斷決策的正確與否衷模。
例如汽車自動尋路鹊汛,機器狗自動爬巖石,機器蛇自動爬越障礙物等等阱冶,都是在強化學習下不斷地測試最后得到正確的決策來實現(xiàn)的刁憋。
二、回歸
例子:汽車一開始受人操控行駛在路面上木蹬,機器根據(jù)司機行駛這條路對應的方向不斷采集數(shù)據(jù)至耻,最后達到監(jiān)督學習的目的,得到回歸的結果镊叁,汽車就能自動進行方向判斷和駕駛了尘颓。
常用公式字符:
m=#tranining examples
x="input" variable/features(特征變量)
y="output" variable/"target" variable(目標變量)
(x,y)training example
i(th) training example = (x(i),y(i)) (樣本列表的第i行)
n=#features(特征值的數(shù)量)