流形學(xué)習(xí)(manifold learning)/圖正則的技術(shù)能發(fā)現(xiàn)數(shù)據(jù)空間的內(nèi)在幾何和區(qū)別結(jié)構(gòu)院尔,這對(duì)分類和聚類任務(wù)有重要作用箫荡。
這些方法都有一個(gè)locally invariant assumption魁亦,即相近的數(shù)據(jù)樣本可能有類似的嵌入(embeddings)。
locally invariant的idea擴(kuò)展到表示學(xué)習(xí)中菲茬,可以表現(xiàn)為sample assumption(被看作局部不變假設(shè))吉挣,高維數(shù)據(jù)采樣于低維的嵌入流形中派撕,故高維空間中相似的兩個(gè)點(diǎn),在低維空間中也相似睬魂。
以非負(fù)矩陣分解(NMF)這一表示技術(shù)為例终吼,圖1中NMF把一個(gè)數(shù)據(jù)矩陣X分解成基矩陣A和系數(shù)矩陣Y,Y是X的低維表示氯哮。把每個(gè)樣本的低維表示s作為頂點(diǎn)际跪,然后學(xué)習(xí)他們的關(guān)系為邊w,可以構(gòu)造一個(gè)圖喉钢,如圖2姆打。
圖1 NMF基本模型
圖2 圖正則項(xiàng)