R語(yǔ)言做Logistic回歸的簡(jiǎn)單小例子

今天的內(nèi)容主要來(lái)自參考書(shū)《R語(yǔ)言實(shí)戰(zhàn)》第二版第十三章第二小節(jié)的內(nèi)容

Logistic回歸的應(yīng)用場(chǎng)景

當(dāng)因變量為二值型結(jié)果變量贺嫂,自變量包括連續(xù)型和類(lèi)別型的數(shù)據(jù)時(shí),Logistic回歸是一個(gè)非常常用的工具怔球。比如今天的例子中用到的婚外情數(shù)據(jù) “Fair's Affairs”敛纲。因變量是時(shí)候有過(guò)婚外情,自變量有8個(gè)荐类,分別是

  • 性別
  • 年齡
  • 婚齡
  • 是否有小孩
  • 宗教信仰程度 (5分制,1表示反對(duì)蹂随,5表示非常信仰)
  • 學(xué)歷
  • 職業(yè) (逆向編號(hào)的戈登7種分類(lèi))這個(gè)是啥意思十嘿?)
  • 對(duì)婚姻的自我評(píng)分

因變量y是出軌次數(shù),我們將其轉(zhuǎn)換成二值型岳锁,出軌次數(shù)大于等于1賦值為1绩衷,相反復(fù)制為0

下面開(kāi)始實(shí)際操作

這個(gè)數(shù)據(jù)集來(lái)自R語(yǔ)言包AER,如果要用這個(gè)數(shù)據(jù)集需要先安裝這個(gè)包

install.packages("AER")

然后使用data()函數(shù)獲取這個(gè)數(shù)據(jù)集

data(Affairs,package = "AER")

然后就可以在環(huán)境的窗口里看到如下


image.png

這個(gè)數(shù)據(jù)集總共有601個(gè)觀察值激率,總共9個(gè)變量

接下來(lái)是將變量y出軌次數(shù)咳燕,轉(zhuǎn)換成二值型
df<-Affairs
df$ynaffairs<-ifelse(df$affairs>0,1,0)
table(df$ynaffairs)
df$ynaffairs<-factor(df$ynaffairs,
                     levels = c(0,1),
                     labels = c("No","Yes"))table
table(df$ynaffairs)
接下來(lái)是擬合模型

擬合模型用到的是glm()函數(shù)

fit.full<-glm(ynaffairs~gender+age+yearsmarried+
                children+religiousness+education+occupation+rating,
              data=df,family = binomial())

通過(guò)summary()函數(shù)查看擬合結(jié)果

summary(fit.full)
image.png

根據(jù)回歸系數(shù)的P值可以看到 性別、是否有孩子乒躺、學(xué)歷招盲、職業(yè)對(duì)方程的貢獻(xiàn)都不顯著。去除這些變量重新擬合模型

fit.reduced<-glm(ynaffairs~age+yearsmarried+
                religiousness+rating,
              data=df,family = binomial())
接下來(lái)是使用anova()函數(shù)對(duì)它們進(jìn)行比較聪蘸,對(duì)于廣義線性回歸,可用卡方檢驗(yàn)
anova(fit.full,fit.reduced,test = "Chisq")
image.png

可以看到結(jié)果中p值等于0.2108大于0.05表制,表明四個(gè)變量和9個(gè)變量的模型你和程度沒(méi)有差別

接下來(lái)是評(píng)價(jià)變量對(duì)結(jié)果概率的影響

構(gòu)造一個(gè)測(cè)試集

testdata<-data.frame(rating=c(1,2,3,4,5),
                     age=mean(df$age),
                     yearsmarried=mean(df$yearsmarried),
                     religiousness=mean(df$religiousness)

預(yù)測(cè)概率

testdata$prob<-predict(fit.reduced,newdata = testdata,
                       type = "response")
簡(jiǎn)單的柱形圖對(duì)結(jié)果進(jìn)行展示
library(ggplot2)
ggplot(testdata,aes(x=rating,y=prob))+
  geom_col(aes(fill=factor(rating)),show.legend = F)+
  geom_label(aes(label=round(prob,2)))+
  theme_bw()
image.png

從這些結(jié)果可以看到健爬,當(dāng)婚姻評(píng)分從1(很不幸福)變?yōu)?(非常幸福)時(shí),婚外情概率從0.53降低到了0.15么介。模型的預(yù)測(cè)結(jié)果和我們的經(jīng)驗(yàn)還挺符合的

好了今天的內(nèi)容就介紹到這里
歡迎大家關(guān)注我的公眾號(hào)
小明的數(shù)據(jù)分析筆記本

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末娜遵,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子壤短,更是在濱河造成了極大的恐慌设拟,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,454評(píng)論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件久脯,死亡現(xiàn)場(chǎng)離奇詭異纳胧,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)帘撰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén)跑慕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人摧找,你說(shuō)我怎么就攤上這事核行。” “怎么了蹬耘?”我有些...
    開(kāi)封第一講書(shū)人閱讀 157,921評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵芝雪,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我综苔,道長(zhǎng)惩系,這世上最難降的妖魔是什么位岔? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,648評(píng)論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮蛆挫,結(jié)果婚禮上赃承,老公的妹妹穿的比我還像新娘。我一直安慰自己悴侵,他們只是感情好瞧剖,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,770評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著可免,像睡著了一般抓于。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上浇借,一...
    開(kāi)封第一講書(shū)人閱讀 49,950評(píng)論 1 291
  • 那天捉撮,我揣著相機(jī)與錄音,去河邊找鬼妇垢。 笑死巾遭,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的闯估。 我是一名探鬼主播灼舍,決...
    沈念sama閱讀 39,090評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼涨薪!你這毒婦竟也來(lái)了骑素?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,817評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤刚夺,失蹤者是張志新(化名)和其女友劉穎献丑,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體侠姑,經(jīng)...
    沈念sama閱讀 44,275評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡创橄,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,592評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了莽红。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片筐摘。...
    茶點(diǎn)故事閱讀 38,724評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖船老,靈堂內(nèi)的尸體忽然破棺而出咖熟,到底是詐尸還是另有隱情,我是刑警寧澤柳畔,帶...
    沈念sama閱讀 34,409評(píng)論 4 333
  • 正文 年R本政府宣布馍管,位于F島的核電站,受9級(jí)特大地震影響薪韩,放射性物質(zhì)發(fā)生泄漏确沸。R本人自食惡果不足惜捌锭,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,052評(píng)論 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望罗捎。 院中可真熱鬧观谦,春花似錦、人聲如沸桨菜。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,815評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)倒得。三九已至泻红,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間霞掺,已是汗流浹背谊路。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,043評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留菩彬,地道東北人缠劝。 一個(gè)月前我還...
    沈念sama閱讀 46,503評(píng)論 2 361
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像骗灶,于是被迫代替她去往敵國(guó)和親惨恭。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,627評(píng)論 2 350

推薦閱讀更多精彩內(nèi)容