機(jī)器學(xué)習(xí)常見問題整理

1. 為什么說regularization是阻止overfitting的好辦法?

overfitting是由high variance導(dǎo)致到逊,high variance 是由特征太多幸撕,特征值過度敏感導(dǎo)致砂缩,regularizer能夠減少特征數(shù)量和降低特征值敏感度阱州,所以說是個(gè)好方法。

模型表現(xiàn)差湖饱,可以因?yàn)槟P吞舭迨已瑁虉?zhí);也可以因?yàn)槭悄P吞S性石挂,太無主見博助;regularizer提供了一個(gè)叫\lambda的旋鈕,調(diào)大能讓模型不要太隨性痹愚,調(diào)小能讓模型不要太呆板富岳。

參考:
一句話版機(jī)器學(xué)習(xí):為什么說regularization是阻止overfitting的好辦法

圖解機(jī)器學(xué)習(xí):為什么以及如何用bias variance診斷模型病癥

課程:Diagnosing Bias vs. Variance
筆記:為什么以及如何用bias variance診斷模型病癥

圖解機(jī)器學(xué)習(xí):為什么說regularizer是模型治療手段(bias variance診斷方式)

課程:Regularization and Bias_Variance
筆記:為什么說regularizer是模型治療手段(bias variance診斷方式)

中期理解整理

李宏毅深度學(xué)習(xí)課程(全2課2017年版)筆記匯總_嗶哩嗶哩 (゜-゜)つロ 干杯~-bilibili

2.16 直觀理解regularization.mp4
3.1 如何直觀理解bias and variance01.mp4
3.2 如何直觀理解bias and variance02.mp4
3.3 如何解決模型的bias過大的問題.mp4
3.4 如何解決variance過高的問題.mp4

早期理解整理

吳恩達(dá)深度學(xué)習(xí)課程(全):掰開揉碎版

1.4 正則化 課程 筆記
1.5 為什么正則化可以減少過擬合蛔糯? 課程 筆記

2. 如何直觀理解PCA的目的和原理?

PCA的目的:是對高維數(shù)據(jù)降維度,作為一種技巧參與到模型訓(xùn)練中實(shí)現(xiàn)提升訓(xùn)練速度效率窖式;

PCA的原理:
一方面蚁飒,通過投影projection將高維數(shù)據(jù)投影到線,平面萝喘,3維飒箭,或K維空間上,在設(shè)定保留數(shù)據(jù)結(jié)構(gòu)信息(比如95%)的條件下蜒灰,通過trial and error 篩選出一個(gè)合適的K值弦蹂,來實(shí)現(xiàn)最大化降低維度和最大化保留數(shù)據(jù)信息的博弈(在這里實(shí)現(xiàn)了多個(gè)eigenvectors數(shù)量的確定即K值);

另一方面强窖,通過比較不同線(平面凸椿,空間)之間的投影距離,選取投影距離之和最短的線作為K=1情況下的最優(yōu)線(在這里完成了eigenvector內(nèi)部值的計(jì)算);

最后翅溺,K個(gè)eigenvectors組合成一個(gè)matrix脑漫,matrix的transposition對原數(shù)據(jù)做變形,變形后的結(jié)果就是降維后的新數(shù)據(jù)咙崎;如果用同一個(gè)matrix還可以對新數(shù)據(jù)做還原优幸,還原后的數(shù)據(jù)是原數(shù)據(jù)到K維空間上的投射點(diǎn)。

參考:

吳恩達(dá)機(jī)器學(xué)習(xí)PCA的視頻課程和筆記理解

圖解機(jī)器學(xué)習(xí):為什么要對數(shù)據(jù)做降維和壓縮褪猛,可視化有助于理解壓縮后的維度內(nèi)涵

課程:Motivation I_ Data Compression Motivation II_ Visualization
筆記:為什么要對數(shù)據(jù)做降維和壓縮网杆,可視化有助于理解壓縮后的維度內(nèi)涵

圖解機(jī)器學(xué)習(xí):如何理解PCA是一種projection降維的最優(yōu)方案以及PCA的算法邏輯

課程:Principal Component Analysis Problem Formulation
課程:Principal Component Analysis Algorithm
筆記:如何理解PCA是一種projection降維的最優(yōu)方案以及PCA的算法邏輯

圖解機(jī)器學(xué)習(xí):PCA是如何通過K尋找最優(yōu)的降維幅度的

課程:Choosing the Number of Principal Components
筆記:PCA是如何通過K尋找最優(yōu)的降維幅度的

圖解機(jī)器學(xué)習(xí):如何理解PCA中的U_reduce, x, z, x_approximation的關(guān)系

課程:Reconstruction from Compressed Representation
筆記:如何理解PCA中的U_reduce, x, z, x_approximation的關(guān)系

圖解機(jī)器學(xué)習(xí):實(shí)際模型訓(xùn)練中如何正確使用PCA和規(guī)避常見錯(cuò)誤用法

課程: Advice for Applying PCA
筆記:實(shí)際模型訓(xùn)練中如何正確使用PCA和規(guī)避常見錯(cuò)誤用法

3. 主成分分析(PCA)主成分維度怎么選擇?

關(guān)于K的內(nèi)涵:PCA目的是降維度伊滋,降維的方法是做投影projection, 假如 [圖片上傳失敗...(image-b49e5c-1537289879749)]

, 那么到底是投影到1維直線上碳却,2維平面上,還是3維空間中笑旺?回答這個(gè)問題昼浦,是K的使命。

關(guān)于K值怎么定:trial and error, 將K=1(直線)筒主,2(平面)关噪,3(空間)。乌妙。使兔。分別帶入到一個(gè)不等式中,選擇那個(gè)最能滿足不等式成立的K值即可冠胯。

關(guān)于這個(gè)不等式:設(shè)定好我們希望PCA保留原有數(shù)據(jù)variance信息的百分比(如95%)火诸,不等式核心內(nèi)容是做最大限度降維與最大化保留數(shù)據(jù)結(jié)構(gòu)信息的博弈。


image

參考:

一句話版機(jī)器學(xué)習(xí):PCA的維數(shù)K應(yīng)該怎么選荠察?

圖解機(jī)器學(xué)習(xí):為什么要對數(shù)據(jù)做降維和壓縮置蜀,可視化有助于理解壓縮后的維度內(nèi)涵

課程:Motivation I_ Data Compression Motivation II_ Visualization
筆記:為什么要對數(shù)據(jù)做降維和壓縮奈搜,可視化有助于理解壓縮后的維度內(nèi)涵

圖解機(jī)器學(xué)習(xí):如何理解PCA是一種projection降維的最優(yōu)方案以及PCA的算法邏輯

課程:Principal Component Analysis Problem Formulation
課程:Principal Component Analysis Algorithm
筆記:如何理解PCA是一種projection降維的最優(yōu)方案以及PCA的算法邏輯

圖解機(jī)器學(xué)習(xí):PCA是如何通過K尋找最優(yōu)的降維幅度的

課程:Choosing the Number of Principal Components
筆記:PCA是如何通過K尋找最優(yōu)的降維幅度的

圖解機(jī)器學(xué)習(xí):如何理解PCA中的U_reduce, x, z, x_approximation的關(guān)系

課程:Reconstruction from Compressed Representation
筆記:如何理解PCA中的U_reduce, x, z, x_approximation的關(guān)系

圖解機(jī)器學(xué)習(xí):實(shí)際模型訓(xùn)練中如何正確使用PCA和規(guī)避常見錯(cuò)誤用法

課程: Advice for Applying PCA
筆記:實(shí)際模型訓(xùn)練中如何正確使用PCA和規(guī)避常見錯(cuò)誤用法

4. 為什么說PCA不應(yīng)該被用來規(guī)避overfitting?

從overfitting角度看,定義中內(nèi)置了Y值盯荤,Y值的監(jiān)督讓我們看到training loss與validation loss的訓(xùn)練足后次數(shù)后的巨大差異馋吗,巨大差異造就了overfitting;

所以沒有Y值秋秤,就談不上overfitting;

從PCA角度看宏粤,PCA眼里只有特征即X,完全無視Y值灼卢,雖然降維后绍哎,仍保持X極高比例的variance信息,但沒有任何依據(jù)說新生成的低維數(shù)據(jù)能提煉任何與Y值相關(guān)的信息鞋真;

因此崇堰,指望PCA規(guī)避overfitting,邏輯上不成立。

參考: 一句話版機(jī)器學(xué)習(xí):為什么說PCA不應(yīng)該被用來規(guī)避overfitting?

更多關(guān)于PCA的吳恩達(dá)課程和筆記涩咖,見:

圖解機(jī)器學(xué)習(xí):為什么要對數(shù)據(jù)做降維和壓縮海诲,可視化有助于理解壓縮后的維度內(nèi)涵

課程:Motivation I_ Data Compression Motivation II_ Visualization
筆記:為什么要對數(shù)據(jù)做降維和壓縮,可視化有助于理解壓縮后的維度內(nèi)涵

圖解機(jī)器學(xué)習(xí):如何理解PCA是一種projection降維的最優(yōu)方案以及PCA的算法邏輯

課程:Principal Component Analysis Problem Formulation
課程:Principal Component Analysis Algorithm
筆記:如何理解PCA是一種projection降維的最優(yōu)方案以及PCA的算法邏輯

圖解機(jī)器學(xué)習(xí):PCA是如何通過K尋找最優(yōu)的降維幅度的

課程:Choosing the Number of Principal Components
筆記:PCA是如何通過K尋找最優(yōu)的降維幅度的

圖解機(jī)器學(xué)習(xí):如何理解PCA中的U_reduce, x, z, x_approximation的關(guān)系

課程:Reconstruction from Compressed Representation
筆記:如何理解PCA中的U_reduce, x, z, x_approximation的關(guān)系

圖解機(jī)器學(xué)習(xí):實(shí)際模型訓(xùn)練中如何正確使用PCA和規(guī)避常見錯(cuò)誤用法

課程: Advice for Applying PCA
筆記:實(shí)際模型訓(xùn)練中如何正確使用PCA和規(guī)避常見錯(cuò)誤用法

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末檩互,一起剝皮案震驚了整個(gè)濱河市特幔,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌闸昨,老刑警劉巖蚯斯,帶你破解...
    沈念sama閱讀 219,110評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異零院,居然都是意外死亡溉跃,警方通過查閱死者的電腦和手機(jī)村刨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,443評論 3 395
  • 文/潘曉璐 我一進(jìn)店門告抄,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人嵌牺,你說我怎么就攤上這事打洼。” “怎么了逆粹?”我有些...
    開封第一講書人閱讀 165,474評論 0 356
  • 文/不壞的土叔 我叫張陵募疮,是天一觀的道長。 經(jīng)常有香客問我僻弹,道長阿浓,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,881評論 1 295
  • 正文 為了忘掉前任蹋绽,我火速辦了婚禮芭毙,結(jié)果婚禮上筋蓖,老公的妹妹穿的比我還像新娘。我一直安慰自己退敦,他們只是感情好粘咖,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,902評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著侈百,像睡著了一般瓮下。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上钝域,一...
    開封第一講書人閱讀 51,698評論 1 305
  • 那天讽坏,我揣著相機(jī)與錄音,去河邊找鬼例证。 笑死震缭,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的战虏。 我是一名探鬼主播拣宰,決...
    沈念sama閱讀 40,418評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼烦感!你這毒婦竟也來了巡社?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,332評論 0 276
  • 序言:老撾萬榮一對情侶失蹤手趣,失蹤者是張志新(化名)和其女友劉穎晌该,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體绿渣,經(jīng)...
    沈念sama閱讀 45,796評論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡朝群,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,968評論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了中符。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片姜胖。...
    茶點(diǎn)故事閱讀 40,110評論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖淀散,靈堂內(nèi)的尸體忽然破棺而出右莱,到底是詐尸還是另有隱情,我是刑警寧澤档插,帶...
    沈念sama閱讀 35,792評論 5 346
  • 正文 年R本政府宣布慢蜓,位于F島的核電站,受9級特大地震影響郭膛,放射性物質(zhì)發(fā)生泄漏晨抡。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,455評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望耘柱。 院中可真熱鬧圆雁,春花似錦、人聲如沸帆谍。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,003評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽汛蝙。三九已至烈涮,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間窖剑,已是汗流浹背坚洽。 一陣腳步聲響...
    開封第一講書人閱讀 33,130評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留西土,地道東北人讶舰。 一個(gè)月前我還...
    沈念sama閱讀 48,348評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像需了,于是被迫代替她去往敵國和親跳昼。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,047評論 2 355

推薦閱讀更多精彩內(nèi)容