Wasserstein distance
定義
-
Wasserstein distance 是在度量空間
肌括,定義概率分布之間距離的距離函數(shù)点骑。
- 定義:讓
作為一個度量空間,每一個在
上的概率測度是一個
測度,(具體這是什么我也不清楚)黑滴。對于
的情況憨募,
表示對于在
度量空間上的
,在
上有有限個
距(moment)的概率測度集合
跷跪,等于:
那么馋嗜,對于兩個分布 和
在
中的
(p階) Wasserstein距離為:
集合 表示在
空間上所有測度的集合齐板,并且這些測度的邊緣分布分別是
和
吵瞻。(又稱為
和
的耦合(coupling))。
變換上式得到:
- 注:什么是距(moments):在數(shù)學(xué)中甘磨,力矩是對函數(shù)形狀的一種特定的定量度量橡羞。定義:關(guān)于值
的實(shí)值連續(xù)函數(shù)
的第
階矩為:
如果 是一個概率密度函數(shù),則上述積分的值稱為概率分布的
階矩济舆;如果
是任何概率分布的累積概率分布函數(shù)卿泽,其中可能沒有密度函數(shù),隨機(jī)變量為
滋觉,則概率分布的第n個矩為:
由此我們得到公式 到
的表示签夭。
- 什么是測度:測度(Measure)是一個函數(shù),它對一個給定集合的某些子集指定一個數(shù)椎侠,這個數(shù)可以比作大小第租、體積、概率等等我纪。 傳統(tǒng)的積分是在區(qū)間上進(jìn)行的慎宾,后來人們希望把積分推廣到任意的集合上,就發(fā)展出測度的概念浅悉,它在數(shù)學(xué)分析和概率論有重要的地位趟据。
Intuition and connection to optimal transport
在Wiki百科中有
Wasserstein distance between two gaussian
- 兩個多元高斯分布之間的2階Wasserstein距離是什么,公式
中的距離函數(shù)
如果是歐幾里得距離的話术健,那么兩個分布之間的2階Wasserstein距離是:
兩個多元高斯分布之間的2階Wasserstein距離 是:
當(dāng)協(xié)方差矩陣可以互換 ,公式
退化為:
- 注:
當(dāng)與
都是對稱矩陣:
汹碱,有:
代碼:
def Wasserstein(mu, sigma, idx1, idx2):
p1 = torch.sum(torch.pow((mu[idx1] - mu[idx2]),2),1)
p2 = torch.sum(torch.pow(torch.pow(sigma[idx1],1/2) - torch.pow(sigma[idx2], 1/2),2) , 1)
return p1+p2
- 矩陣
范數(shù)表示為
,:
上劃線表示矩陣的中每一個數(shù)共軛復(fù)數(shù)荞估。
- 協(xié)方差矩陣:
- 多元高斯部分的情況:是正定矩陣比被。
- 多元高斯部分的情況:考慮一個一般的對稱協(xié)方差矩陣
,其有
個獨(dú)立的參數(shù)泼舱。對于
等缀,又有
個獨(dú)立的參數(shù)。多以一共有
個參數(shù)娇昙。當(dāng)
變大時尺迂,其獨(dú)立的參數(shù)個數(shù)以
的二次方增長。只考慮
是對角陣,即
,我們就只用關(guān)心2D個獨(dú)立的參數(shù)噪裕。
- 參考:
https://zlearning.netlify.com/computer/prml/PRMLch2dot3-gaussian-again.pdf
http://www.robots.ox.ac.uk/~davidc/pubs/tt2015_dac1.pdf
https://en.wikipedia.org/wiki/Wasserstein_metric#cite_note-1
http://djalil.chafai.net/blog/2010/04/30/wasserstein-distance-between-two-gaussians/
https://en.wikipedia.org/wiki/Wasserstein_metric#cite_note-1