PCA簡介
相關(guān)背景
在許多領(lǐng)域的研究與應(yīng)用中阴汇,往往需要對(duì)供應(yīng)的多個(gè)變量進(jìn)行大量的采集数冬,收集大量數(shù)據(jù)以便進(jìn)行分析但尋找規(guī)律。多變量大樣本會(huì)為研究和應(yīng)用提供大量的信息搀庶,也提供了大量的信息吉执。在一定程度上增加了數(shù)據(jù)采集的工作量疯淫,更重要的是在大多數(shù)情況下,許多變量之間可能存在相關(guān)性戳玫,從而增加了問題分析的復(fù)雜性熙掺,同時(shí)對(duì)分析帶來了不便。一個(gè)進(jìn)行分析咕宿,分析往往是孤立的指標(biāo)币绩,而不是綜合的。 發(fā)布會(huì)事件會(huì)損失很多信息府阀,容易產(chǎn)生錯(cuò)誤的結(jié)論缆镣。
因此需要找到一個(gè)合理的方法,在減少需要分析的方法的同時(shí)试浙,盡量減少原因收集信息的損失董瞻,以達(dá)到對(duì)所收集的數(shù)據(jù)進(jìn)行全面分析的目的。由于各變量間的相關(guān)關(guān)系田巴,因此有可能用具體的綜合指標(biāo)分別代表綜合存在于各個(gè)變量中的各種信息钠糊。主要成分分析(PCA)與因素分析就屬于這類降維的方法。