目的:降維的應(yīng)用、概念晃痴、及算法残吩。降維的3個(gè)目的:數(shù)據(jù)壓縮、加速算法(縮小特征變量)倘核、數(shù)據(jù)可視化泣侮。降維本身也是一種無監(jiān)督學(xué)習(xí)算法。
1. Lesson 115 數(shù)據(jù)壓縮
????1. 目的:降維的第一個(gè)應(yīng)用 數(shù)據(jù)壓縮
????2. 內(nèi)容:
??????1. 降維實(shí)際上就是減少特征變量(這里說的降維是針對(duì)特征變量進(jìn)行向量化而言)紧唱,比如3維降到2維就是指3個(gè)特征變量縮小到2個(gè)特征變量
??????2. 當(dāng)特征變量太多活尊,而且重復(fù)度高(相關(guān)性高)在數(shù)據(jù)存儲(chǔ)和算法計(jì)算量上會(huì)造成浪費(fèi)
2. Lesson 116 數(shù)據(jù)可視化
???? 1. 目的:降維的第二個(gè)應(yīng)用 數(shù)據(jù)可視化
???? 2. 內(nèi)容:當(dāng)超過3維之后(超過3個(gè)變量)無法可視化,只有2維和3維才能得到比較理想的可視化
3. Lesson 117 主成分分析問題規(guī)劃1
????1. 目的:介紹主成分分析算法PCA
????2. 內(nèi)容:
?????? 2. PCA與線性回歸不同,前者是點(diǎn)到線的最短垂直距離绰疤,后者是點(diǎn)到線的直線距離(垂直于坐標(biāo)軸)宁仔;前者無預(yù)測(cè)標(biāo)簽(無監(jiān)督),后者有預(yù)測(cè)y(有監(jiān)督)
4. Lesson 118 主成分分析問題規(guī)劃2
????1. 目的:講解PCA具體算法
????2. 內(nèi)容:
?? ????2. PCA具體算法步驟
??????3. 統(tǒng)計(jì)學(xué)基本概念,我們給定一個(gè)含有n個(gè)樣本的集合权埠,下面給出這些概念的公式描述榨了。
??????4. 協(xié)方差及其意義
??????5. 協(xié)方差矩陣
5. Lesson 119 主成分?jǐn)?shù)量選擇
????1. 目的:m維數(shù)據(jù)降到k維,k值的選擇
6. Lesson 120 壓縮重現(xiàn)
????1. 目的:m維數(shù)據(jù)降到K維之后攘蔽,通過K維數(shù)據(jù)恢復(fù)m維數(shù)據(jù)
7. Lesson 121 應(yīng)用PCA建議
????1. 目的:如何應(yīng)用PCA及相關(guān)建議
????2. 內(nèi)容:
??????1. PCA錯(cuò)誤用法:防止過擬合龙屉,防止過擬合正確的做法是正則化
??????2. PCA不是每個(gè)算法中必用的,根據(jù)需要選擇