[機器學習入門] 李宏毅機器學習筆記-14 (Unsupervised Learning: Linear Dimension Reduction;無監(jiān)督學習:線性降維)

[機器學習入門] 李宏毅機器學習筆記-14 (Unsupervised Learning: Linear Dimension
Reduction俩滥;線性降維)

PDF VIDEO

Unsupervised Learning

把Unsupervised Learning分為兩大類:
化繁為簡:有很多種input嘉蕾,進行抽象化處理,只有input沒有output
無中生有:隨機給一個input霜旧,自動畫一張圖错忱,只有output沒有input

這里寫圖片描述

Clustering

有一大堆image ,把他們分為幾大類挂据,給他們貼上標簽以清,將不同的image用相同的
cluster表示。
也面臨一個問題崎逃,要有多少種cluster呢掷倔?
有兩種clustering的方法:

這里寫圖片描述

K-means(K均值)

這里寫圖片描述

Hierarchical Agglomerative Clustering (HAC階層式匯聚分群法)

這里寫圖片描述
這里寫圖片描述

如果說K均值算法的問題是不好卻確定分為幾類,那么HAC的問題在于不知將分類門檻劃在哪一層


Distributed Representation(分布式表征)

光做clustering是很卡的个绍,有的個體并不只屬于一個大類今魔,所以需要一個vector來表示在各個類中的概率勺像。這樣障贸,從一個(高維)圖片到一個各屬性概率(低維)就是一個Dimension Reduction错森。

這里寫圖片描述

Dimension Reduction

為什么說降維是很有用的呢?
有時候在3D種很復雜的圖像到2D種就被簡化了

這里寫圖片描述

在MNIST訓練集中篮洁,很多2828維的向量轉(zhuǎn)成一個image看起來根本不想數(shù)字涩维,其中是digit的vector很少,所以或許我們可以用少于2828維的向量來描述它袁波。
比如下圖一堆3瓦阐,每一個都是28*28維的向量,但是篷牌,我們發(fā)現(xiàn)睡蟋,它們僅僅是角度的不同,所以我們可以加上角度值進行降維枷颊,來簡化表示戳杀。

這里寫圖片描述

那我們應該怎樣做Dimension Reduction呢?
就是要找一個function夭苗。有兩個方法:

  1. Feature selection特征選擇:比如在左圖二維坐標系中信卡,我們發(fā)現(xiàn)X1軸對樣本點影響不大,那么就可以把它拿掉题造。
  2. PCA 主成分分析: 輸出 z=Wx輸入傍菇,找到這個向量W。
這里寫圖片描述

Principle Component Analysis (PCA) 主成分分析

這里寫圖片描述

在一維的例子里界赔,我們要找 z1 方差最大的情況丢习,當維度升高到2維,找 z2 方差最大淮悼,為了避免與 z1 重復咐低,所以規(guī)定 w1 與 w2 垂直。依次方法可進行高維計算敛惊。將所有w轉(zhuǎn)置一下渊鞋,組成一個高維向量,就是我們要找的W瞧挤。

這里寫圖片描述

那么怎樣借w呢锡宋?
Warning of Math

這里寫圖片描述

這里寫圖片描述

這里寫圖片描述

PCA - decorrelation

這里寫圖片描述

PCA – Another Point of View

每個手寫識別,都是由基礎(chǔ)組件構(gòu)成的特恬,把基礎(chǔ)組件加起來执俩,得到一個數(shù)字。
對7來說癌刽,C1\C2\C3\C4\C5分別為1\0\1\0\1

這里寫圖片描述

那我們?nèi)绾握业?u1-uK這K個Vector呢役首?
我們要找K個vector使重構(gòu)誤差越小越好尝丐。

這里寫圖片描述
這里寫圖片描述

轉(zhuǎn)化為Matrix。

這里寫圖片描述

怎么解這個問題呢衡奥?SVD方法爹袁。
matrix X 可以用SVD拆成 matrix U * matrix ∑ * matrix V。

這里寫圖片描述

這樣w已經(jīng)通過SVD求出來了矮固,Ck怎么求呢失息?

這里寫圖片描述
這里寫圖片描述

Weakness of PCA

這里寫圖片描述
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市档址,隨后出現(xiàn)的幾起案子盹兢,更是在濱河造成了極大的恐慌,老刑警劉巖守伸,帶你破解...
    沈念sama閱讀 211,194評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件绎秒,死亡現(xiàn)場離奇詭異,居然都是意外死亡尼摹,警方通過查閱死者的電腦和手機见芹,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,058評論 2 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來窘问,“玉大人辆童,你說我怎么就攤上這事』莺眨” “怎么了把鉴?”我有些...
    開封第一講書人閱讀 156,780評論 0 346
  • 文/不壞的土叔 我叫張陵,是天一觀的道長儿咱。 經(jīng)常有香客問我庭砍,道長,這世上最難降的妖魔是什么混埠? 我笑而不...
    開封第一講書人閱讀 56,388評論 1 283
  • 正文 為了忘掉前任怠缸,我火速辦了婚禮,結(jié)果婚禮上钳宪,老公的妹妹穿的比我還像新娘揭北。我一直安慰自己,他們只是感情好吏颖,可當我...
    茶點故事閱讀 65,430評論 5 384
  • 文/花漫 我一把揭開白布搔体。 她就那樣靜靜地躺著,像睡著了一般半醉。 火紅的嫁衣襯著肌膚如雪疚俱。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,764評論 1 290
  • 那天缩多,我揣著相機與錄音呆奕,去河邊找鬼养晋。 笑死,一個胖子當著我的面吹牛梁钾,可吹牛的內(nèi)容都是我干的绳泉。 我是一名探鬼主播,決...
    沈念sama閱讀 38,907評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼陈轿,長吁一口氣:“原來是場噩夢啊……” “哼圈纺!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起麦射,我...
    開封第一講書人閱讀 37,679評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎灯谣,沒想到半個月后潜秋,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,122評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡胎许,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,459評論 2 325
  • 正文 我和宋清朗相戀三年峻呛,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片辜窑。...
    茶點故事閱讀 38,605評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡钩述,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出穆碎,到底是詐尸還是另有隱情牙勘,我是刑警寧澤,帶...
    沈念sama閱讀 34,270評論 4 329
  • 正文 年R本政府宣布所禀,位于F島的核電站方面,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏色徘。R本人自食惡果不足惜恭金,卻給世界環(huán)境...
    茶點故事閱讀 39,867評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望褂策。 院中可真熱鬧横腿,春花似錦、人聲如沸斤寂。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,734評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽扬蕊。三九已至搀别,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間尾抑,已是汗流浹背歇父。 一陣腳步聲響...
    開封第一講書人閱讀 31,961評論 1 265
  • 我被黑心中介騙來泰國打工蒂培, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人榜苫。 一個月前我還...
    沈念sama閱讀 46,297評論 2 360
  • 正文 我出身青樓护戳,卻偏偏與公主長得像,于是被迫代替她去往敵國和親垂睬。 傳聞我的和親對象是個殘疾皇子媳荒,可洞房花燭夜當晚...
    茶點故事閱讀 43,472評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 夜,晚睡驹饺,也興奮得難以入睡钳枕。萬分期待隔天的香港之旅,因為有熟門熟路的同事帶著赏壹,所以一切好放心鱼炒。 過關(guān),并沒有傳說的...
    阿隋閱讀 169評論 0 0
  • 以后就把這里當作我總結(jié)的地方吧蝌借,剛好可以練習使用東西至于總結(jié)的東西是什么就看著吧昔瞧,感覺自己白活了這么多年!菩佑!
    空也不空閱讀 124評論 0 0
  • 沒有什么是不能成為過去的自晰。 ? “沒有檸檬會酸澀到不能制成檸檬汁”——這句話出自我最近在看的一部美劇《我們這一天》...
    三皮奶閱讀 1,643評論 0 4
  • 一個朋友對她說,最近從你的照片里稍坯,看不到原來那個的你酬荞,眼神里是迷茫的。 她笑著回答劣光,那可能是我換了隱形眼鏡的問題 ...
    甜暖我歆閱讀 753評論 0 4