——本系列翻譯自某大佬博客,是我看到很通俗易懂的邏輯回歸結(jié)果解讀的文章了,在此首先向大佬獻(xiàn)上膝蓋吞瞪。
由于工作中經(jīng)常用到邏輯回歸,也看過不少相關(guān)文章驾孔,自己照貓畫虎寫過腳本,但一直停留在一知半解的程度惯疙,尤其對(duì)于p值如何計(jì)算翠勉,如何解釋,哪些自變量是與因變量相關(guān)的霉颠,不知所以对碌,一臉懵逼。數(shù)學(xué)早還給老師了蒿偎。直到讀到這位大佬的博客朽们,真是開我茅塞怀读。遂決定翻譯過來,主要是做一個(gè)備忘骑脱,方便以后翻閱菜枷。
The KidCreative Logistic Regression
KidCreative數(shù)據(jù)集將作為我講解邏輯回歸結(jié)果解讀的例子,貫穿整個(gè)系列叁丧。通過這個(gè)數(shù)據(jù)集啤誊,我們將嘗試預(yù)測(cè)某個(gè)消費(fèi)者回應(yīng)e-maile并購買兒童雜志“Kid Creative”的可能性。我們通過實(shí)驗(yàn)收集了673組觀看了“Kid Creative”廣告的消費(fèi)者的觀測(cè)數(shù)據(jù)拥娄,其中每組觀測(cè)數(shù)據(jù)記錄了消費(fèi)者是否會(huì)購買蚊锹,以及性別、收入等一系列變量稚瘾。由于因變量(是否購買雜志)是二元的數(shù)據(jù)牡昆,因此適用于邏輯回歸分析。
邏輯回歸分析結(jié)果的系數(shù)表如下:
根據(jù)邏輯回歸的定義摊欠,預(yù)測(cè)一個(gè)消費(fèi)者是否購買:
我們將在后續(xù)的文章中關(guān)注這個(gè)邏輯回歸方程丢烘,當(dāng)前我們主要討論邏輯回歸系數(shù)表。
邏輯回歸的系數(shù)表和最小二乘回歸的系數(shù)表有很多相同之處:
- 都將自變量的名字列在表的最左側(cè)
- 都在第二列回歸系數(shù)的估計(jì)值列
- 都在下一列列出了回歸系數(shù)估計(jì)值的標(biāo)準(zhǔn)差
- 在第四列凄硼,兩個(gè)表都計(jì)算了一個(gè)用于估計(jì)回歸系數(shù)p值的統(tǒng)計(jì)量铅协,這里的邏輯回歸結(jié)果中,該統(tǒng)計(jì)量稱作“z值”摊沉,而在最小二乘回歸中狐史,該統(tǒng)計(jì)量稱作“t值”,但它們都服務(wù)于同一個(gè)目的说墨。
- 隨后的列中骏全,兩個(gè)表都計(jì)算了回歸系數(shù)的p值,此處展示的邏輯回歸結(jié)果中尼斧,p值用概率記法 Pr(> | z |)表示姜贡;最小二乘回歸的結(jié)果中它被記作"p-value",
在對(duì)最小二乘回歸的簡(jiǎn)短回顧中棺棵,我簡(jiǎn)要概述了回歸系數(shù)表的四個(gè)主要用途:
- 評(píng)價(jià)哪個(gè)變量是與因變量相關(guān)的
- 評(píng)價(jià)各自變量的影響大小
- 對(duì)結(jié)果作出預(yù)測(cè)
- 評(píng)價(jià)不確定性
對(duì)于邏輯回歸的結(jié)果楼咳,只有其中一條是與最小二乘回歸有很大區(qū)別的,那就是評(píng)估各自變量的影響烛恤。在隨后的文章中我將逐個(gè)討論回歸系數(shù)表的這四個(gè)用途母怜。