R實現(xiàn)多分類logistic回歸

多分類logistic回歸

在臨床研究中仁热,接觸最多的是二分類數(shù)據(jù)讼撒,如淋巴癌是否轉(zhuǎn)移,是否死亡股耽,這些因變量最后都可以轉(zhuǎn)換成二分類0與1的問題。然后建立二元logistic回歸方程钳幅,可以得到影響因素的OR值物蝙。

那么如果遇到多分類變量,如何進行l(wèi)ogistic回歸呢敢艰?譬如臨床療效分為好诬乞,中,差钠导,三類震嫉,或者根據(jù)指標進行分類,分為高牡属,中票堵,低三類,我用1逮栅、2悴势、3代表作為因變量,進行l(wèi)ogistic回歸分析措伐。


image.png

接下來特纤,該文,主要介紹侥加,如果因變量為三分類變量捧存,如何進行回歸分析及機器學習算法對三分類資料的處理。關于原理理論部分可參見;這里主要講如何在R實現(xiàn)三分類回歸昔穴,計算系數(shù)及p值OR

1.數(shù)據(jù)案例

這里主要用到DALEX包里面包含的HR數(shù)據(jù)镰官,里面記錄了職工在工作崗位的狀態(tài)與年齡,性別傻咖,工作時長朋魔,評價及薪水有關。根據(jù)7847條記錄來評估卿操,如果一個職工屬于男性警检,68歲,薪水及評價處于3等級害淤,那么該職工可能會處于什么狀態(tài)扇雕。

library(DALEX)
library(iBreakDown)
library(nnet)
library(questionr)
try(data(package="DALEX"))
data(HR)
HR= HR %>%  as.tbl() %>% 
  mutate(evaluation=factor(evaluation),
         salary=factor(salary))
HR

## GLM
fit =  multinom(status ~ . , data = HR, probabilities = TRUE, model = TRUE)
summary(fit)
coef(fit)
> summary(fit)
Call:
multinom(formula = status ~ ., data = HR, model = TRUE, probabilities = TRUE)

Coefficients:
         (Intercept) gendermale         age      hours evaluation3 evaluation4 evaluation5
ok          -5.47276 0.03437426 0.002594237 0.08305463 -0.07275332 -0.06763166   -0.156932
promoted   -13.10377 0.10391193 0.004277562 0.19697483 -0.11679839  3.49127986    3.290217
          salary1  salary2  salary3  salary4     salary5
ok       1.543631 2.469598 2.413207 1.758516 -0.09513189
promoted 1.650777 2.498608 2.435680 1.790657 -0.01215312

Std. Errors:
         (Intercept) gendermale         age       hours evaluation3 evaluation4
ok         0.2407953 0.06427342 0.002784445 0.003669856  0.07434565   0.1061762
promoted   0.3475852 0.08023646 0.003458588 0.004692886  0.11569077   0.1303817
         evaluation5   salary1   salary2   salary3   salary4   salary5
ok         0.1077599 0.1199301 0.1227032 0.1219577 0.1212186 0.1371131
promoted   0.1302725 0.1456579 0.1490790 0.1482045 0.1486752 0.1624046

Residual Deviance: 10744.64 
AIC: 10792.64 
> coef(fit)
         (Intercept) gendermale         age      hours evaluation3 evaluation4 evaluation5
ok          -5.47276 0.03437426 0.002594237 0.08305463 -0.07275332 -0.06763166   -0.156932
promoted   -13.10377 0.10391193 0.004277562 0.19697483 -0.11679839  3.49127986    3.290217
          salary1  salary2  salary3  salary4     salary5
ok       1.543631 2.469598 2.413207 1.758516 -0.09513189
promoted 1.650777 2.498608 2.435680 1.790657 -0.01215312

我們構(gòu)建了三元回歸模型,以statusfired為參照窥摄,計算okpromoted中各個因素的系數(shù)镶奉。
有了這些系數(shù),我們就可以寫出回歸方程了崭放,然后再計算各個因素對應的p值
如哨苛,這里的例子介紹了其他因素的系數(shù),然后計算對因變量的方程here

image.png

P值

通過Anova函數(shù)币砂,可以輸出fit中影響因素的p值建峭,其中hoursevaluationsalary有統(tǒng)計學意義决摧。說明他們對員工在職影響很大亿蒸。然后進一步計算or值
需要借助questionr包中的odds.ratio函數(shù)掌桩。

> Anova(fit)
Analysis of Deviance Table (Type II tests)

Response: status
           LR Chisq Df Pr(>Chisq)    
gender          1.7  2     0.4299    
age             1.7  2     0.4329    
hours        3464.1  2     <2e-16 ***
evaluation   2390.2  6     <2e-16 ***
salary       1132.4 10     <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> round(odds.ratio(fit),2)
                        OR 2.5 % 97.5 %      p    
ok/(Intercept)        0.00  0.00   0.01 <2e-16 ***
ok/gendermale         1.03  0.91   1.17   0.59    
ok/age                1.00  1.00   1.01   0.35    
ok/hours              1.09  1.08   1.09 <2e-16 ***
ok/evaluation3        0.93  0.80   1.08   0.33    
ok/evaluation4        0.93  0.76   1.15   0.52    
ok/evaluation5        0.85  0.69   1.06   0.15    
ok/salary1            4.68  3.70   5.92 <2e-16 ***
ok/salary2           11.82  9.29  15.03 <2e-16 ***
ok/salary3           11.17  8.79  14.19 <2e-16 ***
ok/salary4            5.80  4.58   7.36 <2e-16 ***
ok/salary5            0.91  0.69   1.19   0.49    
promoted/(Intercept)  0.00  0.00   0.00 <2e-16 ***
promoted/gendermale   1.11  0.95   1.30   0.20    
promoted/age          1.00  1.00   1.01   0.22    
promoted/hours        1.22  1.21   1.23 <2e-16 ***
promoted/evaluation3  0.89  0.71   1.12   0.31    
promoted/evaluation4 32.83 25.43  42.39 <2e-16 ***
promoted/evaluation5 26.85 20.80  34.66 <2e-16 ***
promoted/salary1      5.21  3.92   6.93 <2e-16 ***
promoted/salary2     12.17  9.08  16.29 <2e-16 ***
promoted/salary3     11.42  8.54  15.27 <2e-16 ***
promoted/salary4      5.99  4.48   8.02 <2e-16 ***
promoted/salary5      0.99  0.72   1.36   0.94    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

參考

  1. MULTINOMIAL LOGISTIC REGRESSION
  2. 邏輯回歸(Logistic Regression)詳解
  3. iBreakDown plots for classification models
  4. MULTINOMIAL LOGISTIC REGRESSION USING R
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末边锁,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子波岛,更是在濱河造成了極大的恐慌茅坛,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,561評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件则拷,死亡現(xiàn)場離奇詭異灰蛙,居然都是意外死亡,警方通過查閱死者的電腦和手機隔躲,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,218評論 3 385
  • 文/潘曉璐 我一進店門摩梧,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人宣旱,你說我怎么就攤上這事仅父。” “怎么了?”我有些...
    開封第一講書人閱讀 157,162評論 0 348
  • 文/不壞的土叔 我叫張陵笙纤,是天一觀的道長耗溜。 經(jīng)常有香客問我,道長省容,這世上最難降的妖魔是什么抖拴? 我笑而不...
    開封第一講書人閱讀 56,470評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮腥椒,結(jié)果婚禮上阿宅,老公的妹妹穿的比我還像新娘。我一直安慰自己笼蛛,他們只是感情好洒放,可當我...
    茶點故事閱讀 65,550評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著滨砍,像睡著了一般往湿。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上惋戏,一...
    開封第一講書人閱讀 49,806評論 1 290
  • 那天领追,我揣著相機與錄音,去河邊找鬼响逢。 笑死蔓腐,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的龄句。 我是一名探鬼主播,決...
    沈念sama閱讀 38,951評論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼散罕,長吁一口氣:“原來是場噩夢啊……” “哼分歇!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起欧漱,我...
    開封第一講書人閱讀 37,712評論 0 266
  • 序言:老撾萬榮一對情侶失蹤职抡,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后误甚,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體缚甩,經(jīng)...
    沈念sama閱讀 44,166評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,510評論 2 327
  • 正文 我和宋清朗相戀三年窑邦,在試婚紗的時候發(fā)現(xiàn)自己被綠了擅威。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,643評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡冈钦,死狀恐怖郊丛,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤厉熟,帶...
    沈念sama閱讀 34,306評論 4 330
  • 正文 年R本政府宣布导盅,位于F島的核電站,受9級特大地震影響揍瑟,放射性物質(zhì)發(fā)生泄漏白翻。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,930評論 3 313
  • 文/蒙蒙 一绢片、第九天 我趴在偏房一處隱蔽的房頂上張望滤馍。 院中可真熱鬧,春花似錦杉畜、人聲如沸纪蜒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,745評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽纯续。三九已至,卻和暖如春灭袁,著一層夾襖步出監(jiān)牢的瞬間猬错,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,983評論 1 266
  • 我被黑心中介騙來泰國打工茸歧, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留倦炒,地道東北人。 一個月前我還...
    沈念sama閱讀 46,351評論 2 360
  • 正文 我出身青樓软瞎,卻偏偏與公主長得像逢唤,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子涤浇,可洞房花燭夜當晚...
    茶點故事閱讀 43,509評論 2 348