首先寻狂,PCA有如下特點(diǎn):
1.要求被降維的數(shù)據(jù)是線性的邓萨。這里的數(shù)據(jù)是指那一列列的向量,比如我們的問題里面锨天,每個(gè)數(shù)據(jù)庫的圖片都變成列向量毯盈,排列成一個(gè)矩陣;
2.要求被降維的數(shù)據(jù)確實(shí)是線性相關(guān)的病袄。PCA分解之后搂赋,每個(gè)向量都可以用一組基向量線性表示,這證明益缠,需要原來每個(gè)向量之間本來就是線性相關(guān)的脑奠。
結(jié)合1,2,PCA的本質(zhì)就是把一組線性相關(guān)的數(shù)據(jù)投影到一個(gè)低維空間幅慌,每個(gè)數(shù)據(jù)都能有更低的維度表示宋欺。或者胰伍,當(dāng)我們?nèi)サ粢恍┨卣髦当容^小的基底時(shí)齿诞,這種低維的表示是比較近似的。
PCA不能解決的問題是數(shù)據(jù)沒有線性相關(guān)性的問題喇辽。例如掌挚,人臉識別的問題。人臉并不能保證總是出現(xiàn)在圖片的相同的位置菩咨,也就是說吠式,我們粗暴的把每個(gè)pixel排列起來形成的列向量,每個(gè)分量之間并不一定存在線性關(guān)系抽米。當(dāng)然特占,PCA在人臉識別中是有應(yīng)用的,不過處理辦法是把關(guān)鍵部位的坐標(biāo)變成列向量云茸,這樣做是目,就必須現(xiàn)有識別的過程,那就不能滿足我們的要求标捺,得到線性的分解表達(dá)式懊纳。
我們的問題,材料圖像的特征提取亡容。這里考慮怎樣在圖片中挖孔的問題嗤疯,當(dāng)這個(gè)特征是空間平移旋轉(zhuǎn)不變的時(shí)候,直接的分解保持線性關(guān)系其實(shí)是不合理的闺兢,因?yàn)閳D片對應(yīng)的列向量中茂缚,不對應(yīng)的pixel可能是有關(guān)系的。也就是說,I=f(I0,I1,I2,...,In)這個(gè)關(guān)系天然是非線性的脚囊。
這個(gè)非線性關(guān)系會帶來兩個(gè)問題:
1.怎么建立龟糕,也就是說,拿什么方法去代替PCA悔耘。由上面的例子讲岁,人臉識別的技術(shù)是可以拿來用的,更寬泛一點(diǎn)淮逊,計(jì)算機(jī)視覺的技術(shù)應(yīng)該都是可以考慮的催首;另外扶踊,機(jī)器學(xué)習(xí)領(lǐng)域泄鹏,autoencoder技術(shù)應(yīng)該是可以用的。
2.怎樣通過圖片的表達(dá)式得到剛度矩陣表達(dá)式秧耗。根據(jù)以前算三次方的經(jīng)驗(yàn)备籽,多項(xiàng)式的關(guān)系都是可以得到的,但是速度會慢很多分井;另外车猬,指數(shù)關(guān)系也應(yīng)該是可以的(不確定)。具體的要先確定上面的非線性關(guān)系再說尺锚。