李宏毅機(jī)器學(xué)習(xí)(二十)無監(jiān)督學(xué)習(xí)Neighbor Embedding近鄰嵌入

Manifold Learning

我們有時(shí)候的特征其實(shí)是低維度的放到高緯度上去箫章,比如地球表面是2維的嗤堰,但是被放到了3維空間浴骂,比如左下的S曲面,其實(shí)可以展開到2維平面上去梦裂,接下來就方便我們進(jìn)一步計(jì)算分類等等

插圖1

我們有如下幾個(gè)降維方法

Locally Linear Emedding(LLE)局部線性嵌入

具體是是怎么做的呢似枕,我們點(diǎn)x和周圍的點(diǎn)xj,給xj每個(gè)點(diǎn)加權(quán)wij求和年柠,使其和xi最接近凿歼,然后投影到向量zi,zj(已降維),使他們之間的關(guān)系系數(shù)還是wij。LLE我們并不一定明確其函數(shù)是如何實(shí)現(xiàn)降維答憔。

插圖1

我們LLE就是找到維度低的zi,zj使得投影過去的線性表示zj和zi最接近

插圖2

LLE最K選幾有一定要求牵咙,K太小不好,K太大了沒有很近才分布到一起攀唯,最終的點(diǎn)還是沒有很好分類

插圖3

Laplacian Eigemmaps拉普拉斯特征圖

我們之前講過smoothness洁桌,2個(gè)點(diǎn)是否一類不是計(jì)算距離而是通過是否平滑連接到一起

插圖4

我們之前講半監(jiān)督學(xué)習(xí)的時(shí)候講過如果x1,x2在高密度區(qū)域連接,那他們很可能是有一個(gè)標(biāo)簽侯嘀,就有了平滑度的公式另凌,等等

插圖5

我們同樣可以對無監(jiān)督學(xué)習(xí)采用smoothness公式,如果要求最小戒幔,但這有沒有問題呢吠谢?我們讓zi=zj=0不就都最小了嗎,所以無監(jiān)督學(xué)習(xí)我們還需要引入一些條件诗茎,如果z的維度是M維工坊,我們希望取得N個(gè)點(diǎn)的空間是M維空間(即不希望N個(gè)點(diǎn)的空間比M維還小)敢订。有人又會說我們半監(jiān)督學(xué)習(xí)并沒有這個(gè)要求啊王污,因?yàn)榘氡O(jiān)督學(xué)習(xí)我們引入了損失函數(shù)和平滑函數(shù),不光由平滑函數(shù)自己決定楚午。

我們把z求出來事實(shí)上和之前求L的特征向量一樣昭齐,只不過是特征值比較小的特征向量,我們得到這樣的向量再做聚類矾柜,就會叫做Spectral Clustering

插圖6

接下來我們講TSNE阱驾,我們之前的方法的確實(shí)現(xiàn)了將距離近的靠在了一起,但是并么有讓距離遠(yuǎn)的分開怪蔑,比如下圖左MNIST和下圖右COIL-20圖片里覆,圖中的像8字的環(huán)形是圖片旋轉(zhuǎn)的效果。

插圖7

TSNE我們計(jì)算xi缆瓣,xj的相似度后除以xi和空間所有其他點(diǎn)相似度的和喧枷,就得到了一般化的分布,我們同樣可以計(jì)算zi,zj我們就是需要他們的分布盡量一致捆愁,就需要梯度下降求割去,但是相似度計(jì)算量太大,我們往往開始需要先降維(比如PCA)昼丑,然后再通過TSNE降維

插圖8

我們知道xi,xj的相似度公式S(x_{i} ,x_{j} )=exp(-\vert x_{i} -x_{j}  \vert ^2 )呻逆,如果是SNE,那z的相似度公式和x一致菩帝,但是TSNE采用了新的相似度公式S(z_{i} ,z_{j} )=1/(1+\vert z_{i} -z_{j}  \vert^2  )這樣有什么好處呢咖城,我們看下圖茬腿,我們x有一定的差異時(shí),反應(yīng)在z上就能很大宜雀,所以采用新的相似度公式

插圖9

所以我們TSNE在MNIST和COIL-20就會有比較明顯的分類效果切平,COIL-20有的圈圈就是圖像不同旋轉(zhuǎn)方向的結(jié)果

插圖10
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市辐董,隨后出現(xiàn)的幾起案子悴品,更是在濱河造成了極大的恐慌,老刑警劉巖简烘,帶你破解...
    沈念sama閱讀 222,252評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件苔严,死亡現(xiàn)場離奇詭異,居然都是意外死亡孤澎,警方通過查閱死者的電腦和手機(jī)届氢,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來覆旭,“玉大人退子,你說我怎么就攤上這事⌒徒” “怎么了寂祥?”我有些...
    開封第一講書人閱讀 168,814評論 0 361
  • 文/不壞的土叔 我叫張陵,是天一觀的道長茶敏。 經(jīng)常有香客問我壤靶,道長缚俏,這世上最難降的妖魔是什么惊搏? 我笑而不...
    開封第一講書人閱讀 59,869評論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮忧换,結(jié)果婚禮上恬惯,老公的妹妹穿的比我還像新娘。我一直安慰自己亚茬,他們只是感情好酪耳,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,888評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著刹缝,像睡著了一般碗暗。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上梢夯,一...
    開封第一講書人閱讀 52,475評論 1 312
  • 那天言疗,我揣著相機(jī)與錄音,去河邊找鬼颂砸。 笑死噪奄,一個(gè)胖子當(dāng)著我的面吹牛死姚,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播勤篮,決...
    沈念sama閱讀 41,010評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼都毒,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了碰缔?” 一聲冷哼從身側(cè)響起账劲,我...
    開封第一講書人閱讀 39,924評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎金抡,沒想到半個(gè)月后涤垫,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,469評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡竟终,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,552評論 3 342
  • 正文 我和宋清朗相戀三年蝠猬,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片统捶。...
    茶點(diǎn)故事閱讀 40,680評論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡榆芦,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出喘鸟,到底是詐尸還是另有隱情匆绣,我是刑警寧澤,帶...
    沈念sama閱讀 36,362評論 5 351
  • 正文 年R本政府宣布什黑,位于F島的核電站崎淳,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏愕把。R本人自食惡果不足惜拣凹,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,037評論 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望恨豁。 院中可真熱鬧嚣镜,春花似錦、人聲如沸橘蜜。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,519評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽计福。三九已至跌捆,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間象颖,已是汗流浹背佩厚。 一陣腳步聲響...
    開封第一講書人閱讀 33,621評論 1 274
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留力麸,地道東北人可款。 一個(gè)月前我還...
    沈念sama閱讀 49,099評論 3 378
  • 正文 我出身青樓育韩,卻偏偏與公主長得像,于是被迫代替她去往敵國和親闺鲸。 傳聞我的和親對象是個(gè)殘疾皇子筋讨,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,691評論 2 361

推薦閱讀更多精彩內(nèi)容