球面上的雙隨機(jī)鄰居嵌入筆記(Doubly Stochastic Neighbor Embedding on Spheres )文章


球面上的雙隨機(jī)鄰居嵌入筆記(Doubly Stochastic Neighbor Embedding on Spheres )

introduction:SNE存在比較嚴(yán)重的擁擠問(wèn)題,這種擁擠問(wèn)題的產(chǎn)生主要是由于SNE傾向于把高階的數(shù)據(jù)點(diǎn)放在中心,而把低階的數(shù)據(jù)點(diǎn)放在外圍這就造成了數(shù)據(jù)的擁擠問(wèn)題纱扭,為了解決這個(gè)問(wèn)題在2003年Laurens van der Maaten和Geoffrey Hinton提出了t-SNE來(lái)解決這個(gè)問(wèn)題做葵。本文作者做出的技術(shù)改進(jìn)是:首先引入了快速歸一化的方法杂穷,把相似矩陣歸一化為雙隨機(jī)予颤,那么所有的數(shù)據(jù)點(diǎn)就具有相等的相似度踢步。用球面的替代平面的嵌入空間從而實(shí)現(xiàn)去中心化而且當(dāng)輸入的矩陣是雙隨機(jī)矩陣的時(shí)候,低維空間的數(shù)據(jù)點(diǎn)將會(huì)嵌入到球體的周圍(通過(guò)下面的圖形可以發(fā)現(xiàn))猪钮,這有助于不同鏃數(shù)據(jù)之間的相似性,如果輸入領(lǐng)域圖(neighborhoodgraph)是非對(duì)稱的可以將其轉(zhuǎn)化為雙隨機(jī)矩陣烤低。其次肘交,如果輸入的矩陣是雙隨機(jī)的那么數(shù)據(jù)點(diǎn)通常會(huì)分布在球上,?根據(jù)這種現(xiàn)象本文將二維歐氏嵌入空間替換為三維空間中的球體扑馁,從而實(shí)現(xiàn)去中心化來(lái)避免出現(xiàn)“擁擠問(wèn)題”。


t-SNE可視化(左)和 DSNES可視化(右)复罐。

通過(guò)上面左邊t-SNE數(shù)據(jù)可視化和右面DSNES可視化可以直觀的發(fā)現(xiàn)DSNES的效果明顯要優(yōu)于t-SNE可視化的效果,有效的解決了擁擠問(wèn)題雄家。

method:輸入矩陣P是個(gè)非負(fù)對(duì)稱矩陣(nonnegative and symmetric matrix )效诅,如果節(jié)點(diǎn)的度(即P的行和或列和)分布高度不均勻,高階節(jié)點(diǎn)的吸引力更大而低階節(jié)點(diǎn)的吸引力更刑思谩(在t-SNE的KL散度梯度下降過(guò)程中乱投,將下降的結(jié)果視為引力和斥力作用的結(jié)果)顷编。所以這就會(huì)造成擁擠問(wèn)題的出現(xiàn)篡腌。為了解決這個(gè)問(wèn)題勾效,對(duì)圖親和力進(jìn)行規(guī)范化使圖的節(jié)點(diǎn)具有相同的度叛甫。使得矩陣的和約束∑_ij P_ij=1同樣對(duì)于雙隨機(jī)也有同樣的定義。

? ? 如果給定的矩陣是一個(gè)非規(guī)范化矩陣(non-normalized matrix)其监,我們可以應(yīng)用Sinkhorn-Knopp的方法將其投影到最近的雙隨機(jī)矩陣P,通過(guò)這種方式來(lái)保證矩陣的稀疏性抖苦。這種方法的原理是:初始化P=S并迭代以下更新規(guī)則,直到P收斂锌历,對(duì)于所有的i都有u_i←Σ_j Pij,對(duì)于所有的i、j也有窗慎。

通過(guò)以下方法也可以構(gòu)造雙隨機(jī)矩陣:假設(shè)反對(duì)稱矩陣B\succeq 0,

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市遮斥,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌术吗,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,277評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件隧魄,死亡現(xiàn)場(chǎng)離奇詭異吝镣,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)末贾,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)拱撵,“玉大人,你說(shuō)我怎么就攤上這事拴测。” “怎么了集索?”我有些...
    開(kāi)封第一講書人閱讀 163,624評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵务荆,是天一觀的道長(zhǎng)妆距。 經(jīng)常有香客問(wèn)我函匕,道長(zhǎng),這世上最難降的妖魔是什么盅惜? 我笑而不...
    開(kāi)封第一講書人閱讀 58,356評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮结啼,結(jié)果婚禮上屈芜,老公的妹妹穿的比我還像新娘妆棒。我一直安慰自己,他們只是感情好动分,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,402評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布红选。 她就那樣靜靜地躺著澜公,像睡著了一般喇肋。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上蝶防,一...
    開(kāi)封第一講書人閱讀 51,292評(píng)論 1 301
  • 那天间学,我揣著相機(jī)與錄音殷费,去河邊找鬼低葫。 笑死,一個(gè)胖子當(dāng)著我的面吹牛嘿悬,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播善涨,決...
    沈念sama閱讀 40,135評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼蟹漓!你這毒婦竟也來(lái)了娶靡?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 38,992評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤姿锭,失蹤者是張志新(化名)和其女友劉穎伯铣,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體腔寡,經(jīng)...
    沈念sama閱讀 45,429評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,636評(píng)論 3 334
  • 正文 我和宋清朗相戀三年忿磅,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片葱她。...
    茶點(diǎn)故事閱讀 39,785評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖搓谆,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情泉手,我是刑警寧澤,帶...
    沈念sama閱讀 35,492評(píng)論 5 345
  • 正文 年R本政府宣布斩萌,位于F島的核電站状囱,受9級(jí)特大地震影響术裸,放射性物質(zhì)發(fā)生泄漏亭枷。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,092評(píng)論 3 328
  • 文/蒙蒙 一猾编、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧答倡,春花似錦、人聲如沸瘪撇。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,723評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)鹏氧。三九已至,卻和暖如春把还,著一層夾襖步出監(jiān)牢的瞬間茸俭,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,858評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工调鬓, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留练俐,地道東北人袖迎。 一個(gè)月前我還...
    沈念sama閱讀 47,891評(píng)論 2 370
  • 正文 我出身青樓燕锥,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親归形。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,713評(píng)論 2 354