CA (Correspondence Analysis)

筆記內(nèi)容:

  • CA(Correspondence Analysis)
  • CA的R實(shí)現(xiàn)馆揉、作圖及解讀
  • 與logistic regression的差別

CA(Correspondence Analysis)

如果沒(méi)有明確的假設(shè)业舍,研究目的為探究列聯(lián)表數(shù)據(jù)中行列兩種變量的關(guān)系,那么分析的結(jié)果需要給出兩個(gè)結(jié)論:兩種變量是否確實(shí)存在關(guān)聯(lián),以及是什么變量與什么變量存在關(guān)聯(lián)舷暮,其強(qiáng)度如何态罪。

首先需要進(jìn)行卡方檢驗(yàn)(the test of independence(chi-square test),驗(yàn)證行變量與列變量是相關(guān)的下面。

CA (Correspondence Analysis)為PCA的一種延伸复颈,適用于探究分類變量之間的關(guān)系。它同樣提供了二維plot, 將變量之間的關(guān)系總結(jié)并可視化沥割。其input為二維的contingency table(2 * 2, r * c)耗啦,目的為探究行列的變量是否存在關(guān)聯(lián)。

CA的R實(shí)現(xiàn)机杜、作圖及解讀

使用factoextra帜讲,fviz_ca_biplot包可以繪制symmetric plot(French plot), 將行列變量均Plot在同一個(gè)圖中。用于對(duì)行列變量的相關(guān)程度有一個(gè)宏觀的了解:行變量(列變量)兩點(diǎn)距離越近椒拗,代表其相似程度越高似将。但是其只能解釋行變量(或列變量)之間的相似程度,不能直接解釋行列變量之間的距離蚀苛。如下圖所示:

使用fviz_ca_biplot(arrows= ..)繪制Asymmetric biplot, 將行列各點(diǎn)與原點(diǎn)的連線作為向量玩郊。行列兩向量之間的夾角越小,代表這兩個(gè)變量關(guān)聯(lián)程度越大枉阵,如下圖所示:

詳細(xì)可見(jiàn)這個(gè)例子
以及一些參考資料: Correspondence analysis (CA)

與Logistic regression的關(guān)系

處理分類型變量最常用的是logistic regression,但并不意味著不管拿來(lái)什么數(shù)據(jù)都往regression里塞预茄。如下表所示兴溜,CA與Logistic regression有適用范圍。

但是用"independent Variable & dependent Variable" 來(lái)形容待分析的變量并不嚴(yán)謹(jǐn)耻陕。在一些情況下有明確的假設(shè)拙徽,研究目的為探究自變量對(duì)因變量的影響程度,或者預(yù)測(cè)因變量的變化诗宣。也存在一些情況膘怕,并沒(méi)有明確的假設(shè),不能把兩類變量簡(jiǎn)單歸為自變量與因變量召庞。研究目的為探究?jī)深愖兞勘容^宏觀的關(guān)聯(lián)程度岛心。可以參考這篇文獻(xiàn)篮灼。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末忘古,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子诅诱,更是在濱河造成了極大的恐慌髓堪,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,635評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異干旁,居然都是意外死亡驶沼,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,543評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門争群,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)回怜,“玉大人,你說(shuō)我怎么就攤上這事祭阀○钠荩” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,083評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵专控,是天一觀的道長(zhǎng)抹凳。 經(jīng)常有香客問(wèn)我,道長(zhǎng)伦腐,這世上最難降的妖魔是什么赢底? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,640評(píng)論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮柏蘑,結(jié)果婚禮上幸冻,老公的妹妹穿的比我還像新娘。我一直安慰自己咳焚,他們只是感情好洽损,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,640評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著革半,像睡著了一般碑定。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上又官,一...
    開(kāi)封第一講書(shū)人閱讀 52,262評(píng)論 1 308
  • 那天延刘,我揣著相機(jī)與錄音,去河邊找鬼六敬。 笑死碘赖,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的外构。 我是一名探鬼主播普泡,決...
    沈念sama閱讀 40,833評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼典勇!你這毒婦竟也來(lái)了劫哼?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,736評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤割笙,失蹤者是張志新(化名)和其女友劉穎权烧,沒(méi)想到半個(gè)月后眯亦,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,280評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡般码,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,369評(píng)論 3 340
  • 正文 我和宋清朗相戀三年妻率,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片板祝。...
    茶點(diǎn)故事閱讀 40,503評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡宫静,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出券时,到底是詐尸還是另有隱情孤里,我是刑警寧澤囊榜,帶...
    沈念sama閱讀 36,185評(píng)論 5 350
  • 正文 年R本政府宣布铃芦,位于F島的核電站剿骨,受9級(jí)特大地震影響旗吁,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜厌殉,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,870評(píng)論 3 333
  • 文/蒙蒙 一只怎、第九天 我趴在偏房一處隱蔽的房頂上張望啡专。 院中可真熱鬧适肠,春花似錦霍衫、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,340評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至逛揩,卻和暖如春峰髓,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背息尺。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,460評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留疾掰,地道東北人搂誉。 一個(gè)月前我還...
    沈念sama閱讀 48,909評(píng)論 3 376
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像静檬,于是被迫代替她去往敵國(guó)和親炭懊。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,512評(píng)論 2 359