基本動(dòng)機(jī):嘗試學(xué)習(xí)出一個(gè)合適的距離度量
馬氏距離:?
表示數(shù)據(jù)的協(xié)方差距離伴挚。它是一種有效的計(jì)算兩個(gè)未知樣本集的相似度的方法纹磺。與歐氏距離不同的是它考慮到各種特性之間的聯(lián)系(例如:一條關(guān)于身高的信息會(huì)帶來(lái)一條關(guān)于體重的信息,因?yàn)閮烧呤怯嘘P(guān)聯(lián)的)
不同的度量學(xué)習(xí)方法針對(duì)不同目標(biāo)獲得“好”的半正定對(duì)稱距離度量矩陣M憔杨,若M是一個(gè)低秩矩陣趁啸,則通過(guò)對(duì)M進(jìn)行特征值分解巨缘,總能找到一組正交基尿赚,其正交基數(shù)目為矩陣M的秩散庶,小于原屬性數(shù)d,于是,度量學(xué)習(xí)學(xué)得的結(jié)果可衍生出一個(gè)降維矩陣P凌净,能用與降維悲龟。