機(jī)器學(xué)習(xí)通常分為四類
- 監(jiān)督學(xué)習(xí)
- 無(wú)監(jiān)督學(xué)習(xí)
- 半監(jiān)督學(xué)習(xí)
- 強(qiáng)化學(xué)習(xí)
監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)是從標(biāo)記的訓(xùn)練數(shù)據(jù)來(lái)推斷一個(gè)功能的機(jī)器學(xué)習(xí)任務(wù)。在監(jiān)督學(xué)習(xí)中面睛,每個(gè)實(shí)例都是由一個(gè)輸入對(duì)象(通常為矢量)和一個(gè)期望的輸出值(也稱為監(jiān)督信號(hào))組成絮蒿。監(jiān)督學(xué)習(xí)算法是分析該訓(xùn)練數(shù)據(jù)尊搬,并產(chǎn)生一個(gè)推斷的功能,其可以用于映射出新的實(shí)例土涝。一個(gè)最佳的方案將允許該算法來(lái)正確地決定那些看不見(jiàn)的實(shí)例的類標(biāo)簽佛寿。
監(jiān)督學(xué)習(xí)有兩個(gè)典型的分類:
- 分類
比如上面的郵件過(guò)濾就是一個(gè)二分類問(wèn)題,分為正例即正常郵件但壮,負(fù)例即垃圾郵件冀泻。 - 回歸
回歸的任務(wù)是預(yù)測(cè)目標(biāo)數(shù)值,比如房屋的價(jià)格蜡饵,給定一組特性(房屋大小弹渔、房間數(shù)等),來(lái)預(yù)測(cè)房屋的售價(jià)溯祸。
常見(jiàn)的監(jiān)督學(xué)習(xí)算法
- k-Nearest Neighbors
- Linear Regression
- Logistic Regression
- Support Vector Machines (SVMs)
- Decision Trees and Random Forests
- Neural networks
無(wú)監(jiān)督學(xué)習(xí)
我們有一些問(wèn)題肢专,但是不知道答案,我們要做的無(wú)監(jiān)督學(xué)習(xí)就是按照他們的性質(zhì)把他們自動(dòng)地分成很多組焦辅,每組的問(wèn)題是具有類似性質(zhì)的(比如數(shù)學(xué)問(wèn)題會(huì)聚集在一組博杖,英語(yǔ)問(wèn)題會(huì)聚集在一組,物理........)
所有數(shù)據(jù)只有特征向量沒(méi)有標(biāo)簽筷登,但是可以發(fā)現(xiàn)這些數(shù)據(jù)呈現(xiàn)出聚群的結(jié)構(gòu)剃根,本質(zhì)是一個(gè)相似的類型的會(huì)聚集在一起。把這些沒(méi)有標(biāo)簽的數(shù)據(jù)分成一個(gè)一個(gè)組合前方,就是聚類(Clustering)
常見(jiàn)的無(wú)監(jiān)督學(xué)習(xí)算法
- Clustering
- k-Means
- Hierarchical Cluster Analysis (HCA)
- Expectation Maximization
- Visualization and dimensionality reduction
- Principal Component Analysis (PCA)
- Kernel PCA
- Locally-Linear Embedding (LLE)
- t-distributed Stochastic Neighbor Embedding (t-SNE)
- Association rule learning
- Apriori
- Eclat
無(wú)監(jiān)督學(xué)習(xí)算法常見(jiàn)工作
- 降維
降維的目標(biāo)是簡(jiǎn)化數(shù)據(jù)狈醉,但是損失盡量少的信息。一個(gè)方法是將幾個(gè)相似的特征或者代表一個(gè)屬性的幾個(gè)特征提取成一個(gè)特征,也是我們通常說(shuō)的特征提取惠险。 -
異常檢測(cè)
比如說(shuō)檢測(cè)信用卡欺詐苗傅,我們用正例來(lái)訓(xùn)練模型,然后當(dāng)一個(gè)新的實(shí)例到來(lái)的時(shí)候莺匠,判斷是否像正實(shí)例金吗,否則就是負(fù)例。
- 關(guān)聯(lián)規(guī)則
可以參照啤酒喝尿布的例子
半監(jiān)督
半監(jiān)督學(xué)習(xí)在訓(xùn)練階段結(jié)合了大量未標(biāo)記的數(shù)據(jù)和少量標(biāo)簽數(shù)據(jù)。與使用所有標(biāo)簽數(shù)據(jù)的模型相比摇庙,使用訓(xùn)練集的訓(xùn)練模型在訓(xùn)練時(shí)可以更為準(zhǔn)確旱物,而且訓(xùn)練成本更低。在現(xiàn)實(shí)任務(wù)中卫袒,未標(biāo)記樣本多宵呛、有標(biāo)記樣本少是一個(gè)比價(jià)普遍現(xiàn)象,如何利用好未標(biāo)記樣本來(lái)提升模型泛化能力夕凝,就是半監(jiān)督學(xué)習(xí)研究的重點(diǎn)宝穗。要利用未標(biāo)記樣本,需假設(shè)未標(biāo)記樣本所揭示的數(shù)據(jù)分布信息與類別標(biāo)記存在聯(lián)系码秉。
強(qiáng)化學(xué)習(xí)
所謂強(qiáng)化學(xué)習(xí)就是智能系統(tǒng)從環(huán)境到行為映射的學(xué)習(xí)逮矛,以使獎(jiǎng)勵(lì)信號(hào)(強(qiáng)化信號(hào))函數(shù)值最大。如果Agent的某個(gè)行為策略導(dǎo)致環(huán)境正的獎(jiǎng)賞(強(qiáng)化信號(hào))转砖,那么Agent以后產(chǎn)生這個(gè)行為策略的趨勢(shì)便會(huì)加強(qiáng) -《百科》
簡(jiǎn)單來(lái)說(shuō)就是給你一只小白鼠在迷宮里面须鼎,目的是找到出口,如果他走出了正確的步子府蔗,就會(huì)給它正反饋(糖)晋控,否則給出負(fù)反饋(點(diǎn)擊),那么姓赤,當(dāng)它走完所有的道路后赡译。無(wú)論比把它放到哪兒,它都能通過(guò)以往的學(xué)習(xí)找到通往出口最正確的道路不铆。強(qiáng)化學(xué)習(xí)的典型案例就是阿爾法狗蝌焚。
其他
此外機(jī)器學(xué)習(xí)還有其它的分類方式,比如批量學(xué)習(xí)和在線學(xué)習(xí)狂男,也可分為參數(shù)學(xué)習(xí)和非參數(shù)學(xué)習(xí)