人工智能-機器學習總結(jié)

數(shù)山有路踊谋,學海無涯:機器學習概論


機器學習的基本原理與基礎概念,其要點如下:

  • 機器學習是計算機基于數(shù)據(jù)構(gòu)建概率統(tǒng)計模型并運用模型對數(shù)據(jù)進行預測與分析的學科罪郊;
  • 根據(jù)輸入輸出類型的不同青责,機器學習可分為分類問題捻撑、回歸問題、標注問題三類价认;
  • 過擬合是機器學習中不可避免的問題嗅定,可通過選擇合適的模型降低其影響;
  • 監(jiān)督學習是目前機器學習的主流任務用踩,包括生成方法和判別方法兩類渠退。
image

簡約而不簡單:線性回歸


線性回歸的基本原理,其要點如下:

  • 線性回歸假設輸出變量是若干輸入變量的線性組合脐彩,并根據(jù)這一關(guān)系求解線性組合中的最優(yōu)系數(shù)碎乃;
  • 最小二乘法可用于解決單變量線性回歸問題,當誤差函數(shù)服從正態(tài)分布時惠奸,它與最大似然估計等價梅誓;
  • 多元線性回歸問題也可以用最小二乘法求解,但極易出現(xiàn)過擬合現(xiàn)象佛南;
  • 嶺回歸和 LASSO 回歸分別通過引入二范數(shù)懲罰項和一范數(shù)懲罰項抑制過擬合梗掰。
image

大道至簡:樸素貝葉斯方法


樸素貝葉斯方法的基本原理,其要點如下:

  • 樸素貝葉斯方法利用后驗概率選擇最佳分類嗅回,后驗概率可以通過貝葉斯定理求解及穗;
  • 樸素貝葉斯方法假定所有屬性相互獨立,基于這一假設將類條件概率轉(zhuǎn)化為屬性條件概率的乘積绵载;
  • 樸素貝葉斯方法可以使期望風險最小化埂陆;
  • 影響樸素貝葉斯分類的是所有屬性之間的依賴關(guān)系在不同類別上的分布。
image

衍化至繁:邏輯回歸


邏輯回歸方法的基本原理娃豹,其要點如下:

  • 邏輯回歸模型是對線性回歸的改進焚虱,用于解決分類問題;
  • 邏輯回歸輸出的是實例屬于每個類別的似然概率培愁,似然概率最大的類別就是分類結(jié)果著摔;
  • 在一定條件下,邏輯回歸模型與樸素貝葉斯分類器是等價的定续;
  • 多分類問題時可以通過多次使用二分類邏輯回歸或者使用 Softmax 回歸解決谍咆。
image

步步為營禾锤,有章可循:決策樹


決策樹的基本原理,其要點如下:

  • 決策樹是包含根節(jié)點摹察、內(nèi)部節(jié)點和葉節(jié)點的樹結(jié)構(gòu)恩掷,通過判定不同屬性的特征來解決分類問題;
  • 決策樹的學習過程包括特征選擇供嚎、決策樹生成黄娘、決策樹剪枝三個步驟;
  • 決策樹生成的基礎是特征選擇克滴,特征選擇的指標包括信息增益逼争、信息增益比和基尼系數(shù);
  • 決策樹的剪枝策略包括預剪枝和后剪枝劝赔。
image

窮則變誓焦,變則通:支持向量機


支持向量機的基本原理,其要點如下:

  • 線性可分支持向量機通過硬間隔最大化求出劃分超平面着帽,解決線性分類問題杂伟;
  • 線性支持向量機通過軟間隔最大化求出劃分超平面,解決線性分類問題仍翰;
  • 非線性支持向量機利用核函數(shù)實現(xiàn)從低維原始空間到高維特征空間的轉(zhuǎn)換赫粥,在高維空間上解決非線性分類問題;
  • 支持向量機的學習是個凸二次規(guī)劃問題予借,可以用 SMO 算法快速求解越平。
image

三個臭皮匠,賽過諸葛亮:集成學習


集成學習的基本原理蕾羊,其要點如下:

  • 集成學習使用多個個體學習器來獲得比每個單獨學習器更好的預測性能喧笔,包括序列化方法和并行化方法兩類;
  • 多樣性要求集成學習中的不同個體學習器之間具有足夠的差異性龟再;
  • 序列化方法采用 Boosting 機制书闸,通過重復使用概率分布不同的訓練數(shù)據(jù)實現(xiàn)集成,可以降低泛化誤差中的偏差利凑;
  • 并行化方法采用 Bagging 機制浆劲,通過在訓練數(shù)據(jù)中多次自助抽取不同的采樣子集實現(xiàn)集成,可以降低泛化誤差中的方差哀澈。
image

物以類聚牌借,人以群分:聚類分析


聚類分析的基本原理,其要點如下:

  • 聚類分析是一種無監(jiān)督學習方法割按,通過學習沒有分類標記的訓練樣本發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在性質(zhì)和規(guī)律膨报;
  • 數(shù)據(jù)之間的相似性通常用距離度量,類內(nèi)差異應盡可能小,類間差異應盡可能大现柠;
  • 根據(jù)形成聚類方式的不同院领,聚類算法可以分為層次聚類、原型聚類够吩、分布聚類比然、密度聚類等幾類;
  • 聚類分析的一個重要應用是對用戶進行分組與歸類周循。
image

好鋼用在刀刃上:降維學習


主成分分析是一種主要的降維方法强法,另一種更加直觀的降維方式則是直接對樣本的屬性做出篩選,這種降維方法就是“特征選擇”湾笛,其要點如下:

  • 主成分分析利用正交變換將可能存在相關(guān)性的原始屬性轉(zhuǎn)換成一組線性無關(guān)的新屬性饮怯,并通過選擇重要的新屬性實現(xiàn)降維;
  • 主成分分析的解滿足最大方差和最小均方誤差兩類約束條件迄本,因而具有最大可分性和最近重構(gòu)性硕淑;
  • 特征選擇則是選取原始特征中的一個子集用于學習任務课竣,是另一種主要的降維技術(shù)嘉赎;
  • 特征選擇的關(guān)鍵問題是對特征子集的評價,主要的特征選擇算法包括包裹法于樟、過濾法和嵌入法公条。
image

拓展閱讀參考書


image

總結(jié)自:人工智能基礎課: https://time.geekbang.org/column/62

簡寶玉寫作群日更打卡第 36 天

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市迂曲,隨后出現(xiàn)的幾起案子靶橱,更是在濱河造成了極大的恐慌,老刑警劉巖路捧,帶你破解...
    沈念sama閱讀 212,599評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件关霸,死亡現(xiàn)場離奇詭異,居然都是意外死亡杰扫,警方通過查閱死者的電腦和手機队寇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,629評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來章姓,“玉大人佳遣,你說我怎么就攤上這事》惨粒” “怎么了零渐?”我有些...
    開封第一講書人閱讀 158,084評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長系忙。 經(jīng)常有香客問我诵盼,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,708評論 1 284
  • 正文 為了忘掉前任风宁,我火速辦了婚禮耕腾,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘杀糯。我一直安慰自己扫俺,他們只是感情好,可當我...
    茶點故事閱讀 65,813評論 6 386
  • 文/花漫 我一把揭開白布固翰。 她就那樣靜靜地躺著狼纬,像睡著了一般。 火紅的嫁衣襯著肌膚如雪骂际。 梳的紋絲不亂的頭發(fā)上疗琉,一...
    開封第一講書人閱讀 50,021評論 1 291
  • 那天,我揣著相機與錄音歉铝,去河邊找鬼盈简。 笑死,一個胖子當著我的面吹牛太示,可吹牛的內(nèi)容都是我干的柠贤。 我是一名探鬼主播,決...
    沈念sama閱讀 39,120評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼类缤,長吁一口氣:“原來是場噩夢啊……” “哼臼勉!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起餐弱,我...
    開封第一講書人閱讀 37,866評論 0 268
  • 序言:老撾萬榮一對情侶失蹤宴霸,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后膏蚓,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體瓢谢,經(jīng)...
    沈念sama閱讀 44,308評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,633評論 2 327
  • 正文 我和宋清朗相戀三年驮瞧,在試婚紗的時候發(fā)現(xiàn)自己被綠了氓扛。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,768評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡剧董,死狀恐怖幢尚,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情翅楼,我是刑警寧澤尉剩,帶...
    沈念sama閱讀 34,461評論 4 333
  • 正文 年R本政府宣布,位于F島的核電站毅臊,受9級特大地震影響理茎,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,094評論 3 317
  • 文/蒙蒙 一皂林、第九天 我趴在偏房一處隱蔽的房頂上張望朗鸠。 院中可真熱鬧,春花似錦础倍、人聲如沸烛占。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,850評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽忆家。三九已至,卻和暖如春德迹,著一層夾襖步出監(jiān)牢的瞬間芽卿,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,082評論 1 267
  • 我被黑心中介騙來泰國打工胳搞, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留卸例,地道東北人。 一個月前我還...
    沈念sama閱讀 46,571評論 2 362
  • 正文 我出身青樓肌毅,卻偏偏與公主長得像筷转,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子芽腾,可洞房花燭夜當晚...
    茶點故事閱讀 43,666評論 2 350

推薦閱讀更多精彩內(nèi)容

  • 機器學習是做NLP和計算機視覺這類應用算法的基礎旦装,雖然現(xiàn)在深度學習模型大行其道,但是懂一些傳統(tǒng)算法的原理和它們之間...
    在河之簡閱讀 20,491評論 4 65
  • 注:題中所指的『機器學習』不包括『深度學習』摊滔。本篇文章以理論推導為主,不涉及代碼實現(xiàn)店乐。 前些日子定下了未來三年左右...
    我偏笑_NSNirvana閱讀 39,939評論 12 145
  • 101.深度學習(CNN RNN Attention)解決大規(guī)模文本分類問題艰躺。 用深度學習(CNN RNN Att...
    大黃大黃大黃閱讀 13,773評論 2 42
  • 什么是自由的表達? 記得在幸福家里眨八,黃雅瑋老師帶領(lǐng)過一個活動腺兴,什么是家,什么是幸福廉侧。什么是自由页响?那家有一個必要的要...
    周蜜2019閱讀 367評論 0 0
  • 第三部分:中國哲學的發(fā)展 經(jīng)過秦的統(tǒng)一,中國進入了中央集權(quán)的帝國模式段誊,這個模式持續(xù)了近2000年闰蚕,這期間,哲學家一...
    周三的世界閱讀 292評論 0 0