機器學(xué)習(xí)算法之旅

這篇文章绣的,我們將了解最流行的機器學(xué)習(xí)算法。

用兩種方法來對機器學(xué)習(xí)算法進行分組戚篙。

  • 按照學(xué)習(xí)風格進行分組
  • 按照算法的功能相似性進行分組

兩種方法都可行五鲫,但本文更關(guān)注第二種方法。
通過閱讀本文岔擂,你將對目前流行的關(guān)于監(jiān)督學(xué)習(xí)的機器學(xué)習(xí)算法以及它們之間的關(guān)系會有更好的理解位喂。

按照學(xué)習(xí)風格分組的機器學(xué)習(xí)算法

讓我們看看三種不同學(xué)習(xí)風格的機器學(xué)習(xí)算法。

1.監(jiān)督學(xué)習(xí)(Supervised Learning)

輸入數(shù)據(jù)含有標簽乱灵,例如:是否是垃圾郵件塑崖、某天的股票價格。
用帶標簽的數(shù)據(jù)來訓(xùn)練模型痛倚,然后利用模型來預(yù)測未見過的數(shù)據(jù)的標簽规婆。
一般用來處理分類和回歸問題。
e.g:

  • 線性回歸(Linear Regression)
  • 邏輯回歸(Logistics Regression)
  • 支持向量機(Support Vector Machine)
  • 決策樹(Decision Tree)
  • 樸素貝葉斯(naive bayes)

2.非監(jiān)督學(xué)習(xí)(Unsupervised Learning)

輸入數(shù)據(jù)不帶標簽蝉稳,模型通過推導(dǎo)輸入數(shù)據(jù)的結(jié)構(gòu)來提取數(shù)據(jù)的一般規(guī)則抒蚜。
一般用來處理聚類、降維颠区、關(guān)聯(lián)規(guī)則學(xué)習(xí)削锰。
e.g:

  • Apriori Algorithm
  • K-Means

3.半監(jiān)督學(xué)習(xí)(Semi-Supervised Learning)

輸入數(shù)據(jù)部分有標簽,部分沒有標簽毕莱。
通過學(xué)習(xí)輸入數(shù)據(jù)的一般規(guī)則來更好的預(yù)測標簽器贩。
一般用來處理分類和回歸問題。

目前比較火的是半監(jiān)督學(xué)習(xí)朋截,它可以對數(shù)量很大但是只有少量數(shù)據(jù)帶有標簽的數(shù)據(jù)集進行預(yù)測蛹稍,例如圖像分類問題。

按照算法功能的相似性進行分組

這是最常用的分組方法部服。
雖然本文沒有列出所有的算法唆姐,但是具有一定的代表性。

回歸算法(Regression Algorithm)

回歸算法為變量之間的關(guān)系建模廓八。
回歸算法是統(tǒng)計機器學(xué)習(xí)的主流方法奉芦。
e.g:

  • Ordinary Least Squares Regression (OLSR)
  • Linear Regression
  • Logistic Regression
  • Stepwise Regression
  • Multivariate Adaptive Regression Splines (MARS)
  • Locally Estimated Scatterplot Smoothing (LOESS)

基于實例算法(Instance-based Algorithm)

基于實例算法不對模型進行訓(xùn)練赵抢,只是存儲訓(xùn)練數(shù)據(jù)。利用相似性度量(例如KNN中的距離函數(shù))來對比新數(shù)據(jù)和訓(xùn)練數(shù)據(jù)声功,從而找出最匹配的模式和進行預(yù)測烦却。
因為這樣,基于實例算法又叫基于記憶算法先巴。
e.g:

  • k-Nearest Neighbor (kNN)
  • Learning Vector Quantization (LVQ)
  • Self-Organizing Map (SOM)
  • Locally Weighted Learning (LWL)

正則化算法(Regularization Algorithm)

其他算法(一般是回歸算法)的擴展算法其爵。
e.g:

  • Ridge Regression
  • Least Absolute Shrinkage and Selection Operator (LASSO)
  • Elastic Net
  • Least-Angle Regression (LARS)

決策樹算法(Decision Tree Algorithm)

決策樹的理論基礎(chǔ)是:信息、熵伸蚯、信息增益
決策樹具有速度快和準確率高的優(yōu)點摩渺,是很受歡迎的機器學(xué)習(xí)算法,一般用于分類和回歸問題剂邮。
e.g:

  • Classification and Regression Tree (CART)
  • Iterative Dichotomiser 3 (ID3)
  • C4.5 and C5.0 (different versions of a powerful approach)
  • Chi-squared Automatic Interaction Detection (CHAID)
  • Decision Stump
  • M5
  • Conditional Decision Trees

貝葉斯算法(Bayesian Algorithm)

貝葉斯算法是基于貝葉斯定理摇幻,一般用于分類和回歸問題。
e.g:

  • Naive Bayes
  • Gaussian Naive Bayes
  • Multinomial Naive Bayes
  • Averaged One-Dependence Estimators (AODE)
  • Bayesian Belief Network (BBN)
  • Bayesian Network (BN)

聚類算法(Clustering Algorithm)

聚類抗斤,就是利用數(shù)據(jù)固有的結(jié)構(gòu)對數(shù)據(jù)進行分組聚類囚企,使各組數(shù)據(jù)具有最大的共性。
e.g:

  • k-Means
  • k-Medians
  • Expectation Maximisation (EM)
  • Hierarchical Clustering

關(guān)聯(lián)規(guī)則學(xué)習(xí)算法(Association Rule Learning Algorithms)

提取最能描述變量間關(guān)系的規(guī)則瑞眼。
e.g:

  • Apriori algorithm
  • Eclat algorithm

人工神經(jīng)網(wǎng)絡(luò)算法(Artificial Neural Network Algorithm)

人工神經(jīng)網(wǎng)絡(luò)算法是受啟發(fā)于生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。
e.g:

  • Perceptron
  • Back-Propagation
  • Hopfield Network
  • Radial Basis Function Network (RBFN)

深度學(xué)習(xí)算法(Deep Learning Algorithm)

深度學(xué)習(xí)算法是人工神經(jīng)網(wǎng)絡(luò)算法的升級版棵逊,具有更復(fù)雜的神經(jīng)網(wǎng)絡(luò)伤疙,多數(shù)用于半監(jiān)督學(xué)習(xí)。
e.g:

  • Deep Boltzmann Machine (DBM)
  • Deep Belief Networks (DBN)
  • Convolutional Neural Network (CNN)
  • Stacked Auto-Encoders

降維算法(Dimensionality Reduction Algorithm)

在監(jiān)督學(xué)習(xí)算法中辆影,常用于簡化數(shù)據(jù)和可視化數(shù)據(jù)徒像,適用于分類和回歸問題。
e.g:

  • Principal Component Analysis (PCA)
  • Principal Component Regression (PCR)
  • Partial Least Squares Regression (PLSR)
  • Sammon Mapping
  • Multidimensional Scaling (MDS)
  • Projection Pursuit
  • Linear Discriminant Analysis (LDA)
  • Mixture Discriminant Analysis (MDA)
  • Quadratic Discriminant Analysis (QDA)
  • Flexible Discriminant Analysis (FDA)

集成算法(Ensemble Algorithm)

集成方法是由多個獨立訓(xùn)練的弱學(xué)習(xí)器組成蛙讥,通過某種方式(例如:多數(shù)投票法锯蛀、平均法等)將各個弱學(xué)習(xí)器的預(yù)測結(jié)果結(jié)合成總體的預(yù)測。
e.g:

  • Boosting
  • Bootstrapped Aggregation (Bagging)
  • AdaBoost
  • Stacked Generalization (blending)
  • Gradient Boosting Machines (GBM)
  • Gradient Boosted Regression Trees (GBRT)
  • Random Forest(適合用隨機調(diào)參)

其他算法

支持向量機(Support Vector Machine)(間隔最大化)
各個領(lǐng)域的機器學(xué)習(xí)算法

  • Computational intelligence (evolutionary algorithms, etc.)
  • Computer Vision (CV)
  • Natural Language Processing (NLP)
  • Recommender Systems
  • Reinforcement Learning
  • Graphical Models
machine learning aigorithms mind map

引用:https://machinelearningmastery.com/a-tour-of-machine-learning-algorithms/

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末次慢,一起剝皮案震驚了整個濱河市旁涤,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌迫像,老刑警劉巖劈愚,帶你破解...
    沈念sama閱讀 222,000評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異闻妓,居然都是意外死亡菌羽,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,745評論 3 399
  • 文/潘曉璐 我一進店門由缆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來注祖,“玉大人猾蒂,你說我怎么就攤上這事∈浅浚” “怎么了肚菠?”我有些...
    開封第一講書人閱讀 168,561評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長署鸡。 經(jīng)常有香客問我案糙,道長,這世上最難降的妖魔是什么靴庆? 我笑而不...
    開封第一講書人閱讀 59,782評論 1 298
  • 正文 為了忘掉前任时捌,我火速辦了婚禮,結(jié)果婚禮上炉抒,老公的妹妹穿的比我還像新娘奢讨。我一直安慰自己,他們只是感情好焰薄,可當我...
    茶點故事閱讀 68,798評論 6 397
  • 文/花漫 我一把揭開白布拿诸。 她就那樣靜靜地躺著,像睡著了一般塞茅。 火紅的嫁衣襯著肌膚如雪亩码。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,394評論 1 310
  • 那天野瘦,我揣著相機與錄音描沟,去河邊找鬼。 笑死鞭光,一個胖子當著我的面吹牛吏廉,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播惰许,決...
    沈念sama閱讀 40,952評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼席覆,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了汹买?” 一聲冷哼從身側(cè)響起佩伤,我...
    開封第一講書人閱讀 39,852評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎卦睹,沒想到半個月后畦戒,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,409評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡结序,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,483評論 3 341
  • 正文 我和宋清朗相戀三年障斋,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,615評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡垃环,死狀恐怖邀层,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情遂庄,我是刑警寧澤寥院,帶...
    沈念sama閱讀 36,303評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站涛目,受9級特大地震影響秸谢,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜霹肝,卻給世界環(huán)境...
    茶點故事閱讀 41,979評論 3 334
  • 文/蒙蒙 一估蹄、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧沫换,春花似錦臭蚁、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,470評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至漱挎,卻和暖如春系枪,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背磕谅。 一陣腳步聲響...
    開封第一講書人閱讀 33,571評論 1 272
  • 我被黑心中介騙來泰國打工嗤无, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人怜庸。 一個月前我還...
    沈念sama閱讀 49,041評論 3 377
  • 正文 我出身青樓,卻偏偏與公主長得像垢村,于是被迫代替她去往敵國和親割疾。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,630評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 機器學(xué)習(xí)(Machine Learning)&深度學(xué)習(xí)(Deep Learning)資料(Chapter 1) 注...
    Albert陳凱閱讀 22,266評論 9 476
  • 從明天開始跑家嘉栓,學(xué)會辛苦宏榕,學(xué)會和父母相處,知道自己要的是什么侵佃,每天早上公交先計劃麻昼,后補覺,晚上公交先上車思考馋辈,總結(jié)...
    Times刺猬兒閱讀 184評論 0 0
  • 摘要:戲劇程式內(nèi)涵與探尋抚芦,本質(zhì)屬性,方式方法,造型材料叉抡,內(nèi)容來源與推想尔崔,表現(xiàn)與體驗。 程式褥民,是戲劇創(chuàng)作在文學(xué)劇本季春,...
    張靜年閱讀 831評論 1 8
  • 漫飲黃昏霞燙酒,閑聽夜半雨敲詩消返。 小荷莫笑東君老载弄,遍撒銀鉤釣玉池。 ——魚兒
    牧魚齋主閱讀 597評論 6 5