1 什么是機(jī)器學(xué)習(xí)
A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.(Tom Mitchell,1998)
一句話概括:計(jì)算機(jī)通過觀察數(shù)據(jù)從而獲取技巧的過程。
2 機(jī)器學(xué)習(xí)算法
2.1 監(jiān)督學(xué)習(xí)
數(shù)據(jù)集中的每個(gè)樣本都有相應(yīng)的 “標(biāo)簽”享幽。相當(dāng)于我們知道輸入對應(yīng)的正確輸出啄寡。
監(jiān)督學(xué)習(xí)有兩類問題:
- 分類問題:其目標(biāo)是預(yù)測出一組離散的結(jié)果。例如預(yù)測病人是否患癌癥(0:否串纺, 1:是)
- 回歸問題:其目標(biāo)是預(yù)測出一組連續(xù)的結(jié)果丽旅。例如給定房子的面積信息,預(yù)測出房價(jià)纺棺。
2.2 無監(jiān)督學(xué)習(xí)
給定的數(shù)據(jù)沒有任何標(biāo)簽榄笙,或者都是相同的標(biāo)簽。無監(jiān)督的學(xué)習(xí)中祷蝌,我們很少或根本不知道我們的結(jié)果應(yīng)該是什么樣的茅撞。我們可以通過聚類,推出數(shù)據(jù)中變量之間的聯(lián)系。
比如聚類問題:新聞主題分類米丘,社交網(wǎng)絡(luò)分析(朋友分組)剑令,市場分類(對顧客進(jìn)行市場細(xì)分)