t-SNE是一種降維后可視化算法,但降維后的數(shù)據(jù)是無法放入模型中的蚁堤,僅僅是起到肉眼評估作用。
PCA的降維方式是線性的,而t-SEN的降維方式是非線性的熟空。
t-SEN的距離是歐式距離,因此也無法避免高維詛咒息罗。
首先,SEN對高維空間中距離相近的數(shù)據(jù)構(gòu)建一個分布迈喉,同時對這些點(diǎn)在低維空間構(gòu)建一個分布,使得這兩個分布盡可能相似挨摸。SEN用高斯分布將距離轉(zhuǎn)化為概率概率分布,t-SEN則是在低維空間映射一個t分布得运,因?yàn)閠分布更加偏重長尾分布并且受異常值影響較小。