廣義線性模型一(Generalized Linear Models冈爹,GLM)

參考
從線性模型到廣義線性模型(1)——模型假設(shè)篇 | 統(tǒng)計之都 (cosx.org)

一刊头、廣義線性模型和線性模型

廣義線性模型(Generalized Linear Models型酥,GLM)由Nelder和Wedderburn于 1972年提出和發(fā)表 侍咱,旨在解決普通線性回歸模型無法處理因變量離散柠并,并發(fā)展能夠解決非正態(tài)因變量的回歸建模任務(wù)的建模方法岭接。

在廣義線性模型的框架下,因變量不再要求連續(xù)臼予、正態(tài)鸣戴,當(dāng)然自變量更加沒有特殊的要求。能夠?qū)?strong>正態(tài)分布粘拾、二項分布窄锅、泊松分布、Gamma分布等隨機因變量進行建模.

通俗來說缰雇,廣義線性模型是普通線性模型的普遍化入偷,如果把普通線性回歸模型稱為狹義線性模型,那么它就是廣義線性模型中因變量服從正態(tài)分布的一個特例

二械哟、廣義線性模型的適用范圍

結(jié)果變量是類別:包括二分類變量(是/否)和多分類變量(優(yōu)秀/良好/差)
結(jié)果變量是非負(fù)整數(shù):結(jié)婚次數(shù)疏之、一生中流產(chǎn)的次數(shù),他們的均值和方差通常是相關(guān)的

建模方法論
1) 假設(shè)因變量服從某個隨機分布暇咆,如正態(tài)分布锋爪、二項分布
2) 根據(jù)上述的假設(shè)分布構(gòu)建因變量的轉(zhuǎn)換形式(參考下文的鏈接函數(shù))
3) 對轉(zhuǎn)換后的隨機變量進行線性擬合

三種常見的廣義線性模型

正態(tài)分布(特殊類型的廣義線性模型)

image.png

二項分布變量

image.png

泊松分布

image.png

三丙曙、廣義線性模型的R語言實現(xiàn)

glm(formula, family = gaussian, data, weights, subset,
    na.action, start = NULL, etastart, mustart, offset,
    control = list(...), model = TRUE, method = "glm.fit",
    x = FALSE, y = TRUE, singular.ok = TRUE, contrasts = NULL, ...)

概率分布family及連接函數(shù) function
binomial(link = "logit")
gaussian(link = "identity")
Gamma(link = "inverse")
inverse.gaussian(link = "1/mu^2")
poisson(link = "log")
quasi(link = "identity", variance = "constant")
quasibinomial(link = "logit")
quasipoisson(link = "log")

使用以下函數(shù)提取擬合模型中的有用信息


image.png
1、展示數(shù)據(jù)并構(gòu)建模型

使用Affairs數(shù)據(jù)展示logistic回歸

# get summary statistics
data(Affairs, package="AER")
summary(Affairs)
table(Affairs$affairs)
image.png
# create binary outcome variable
Affairs$ynaffair[Affairs$affairs > 0] <- 1
Affairs$ynaffair[Affairs$affairs == 0] <- 0
Affairs$ynaffair <- factor(Affairs$ynaffair, 
                           levels=c(0,1),
                           labels=c("No","Yes"))
table(Affairs$ynaffair)

為了演示其骄,這里生成一個二分類變量ynaffair(是否婚外遇)


image.png
# fit full model
fit.full <- glm(ynaffair ~ gender + age + yearsmarried + children + 
                  religiousness + education + occupation +rating,
                data=Affairs,family=binomial())
summary(fit.full)

將所有變量納入回歸方程亏镰,得到fit.full,使用summary函數(shù)看一下模型的內(nèi)部構(gòu)成


image.png
# fit reduced model
fit.reduced <- glm(ynaffair ~ age + yearsmarried + religiousness + 
                     rating, data=Affairs, family=binomial())
summary(fit.reduced)

接下來將有意義的進一步納入回歸拯爽,然后 summary看一下函數(shù)內(nèi)部:


image.png
2索抓、模型間比較

可以看到,fit.full與fit.reduced的AIC差異并不到毯炮,后面我們繼續(xù)學(xué)習(xí)AIC的含義逼肯,這里我們簡單介紹以下AIC越接近0代表模型越優(yōu)。
為了進一步比較兩個模型否副,使用ANOVA函數(shù)比較

# compare models
anova(fit.reduced, fit.full, test="Chisq")
image.png

可以看到p值大于0.05汉矿,兩個模型差異無統(tǒng)計學(xué)意義。

3备禀、模型中關(guān)鍵參數(shù)的提取

coef與coefficients得到的結(jié)果一樣洲拇,都是每個變量的系數(shù),反對數(shù)后曲尸,得到每個變量的OR值(相對風(fēng)險)

coef(fit.full)
coefficients(fit.full)
exp(coef(fit.full))
image.png

本篇篇幅暫時不再擴展赋续,下一篇繼續(xù)廣義線性模型的預(yù)測,效能評估及列線圖等展示另患。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末纽乱,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子昆箕,更是在濱河造成了極大的恐慌鸦列,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件鹏倘,死亡現(xiàn)場離奇詭異薯嗤,居然都是意外死亡,警方通過查閱死者的電腦和手機纤泵,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進店門骆姐,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人捏题,你說我怎么就攤上這事玻褪。” “怎么了公荧?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵带射,是天一觀的道長。 經(jīng)常有香客問我循狰,道長窟社,這世上最難降的妖魔是什么捻浦? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮桥爽,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘昧识。我一直安慰自己钠四,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布跪楞。 她就那樣靜靜地躺著缀去,像睡著了一般。 火紅的嫁衣襯著肌膚如雪甸祭。 梳的紋絲不亂的頭發(fā)上缕碎,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天,我揣著相機與錄音池户,去河邊找鬼咏雌。 笑死,一個胖子當(dāng)著我的面吹牛校焦,可吹牛的內(nèi)容都是我干的赊抖。 我是一名探鬼主播,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼寨典,長吁一口氣:“原來是場噩夢啊……” “哼氛雪!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起耸成,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤报亩,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后井氢,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體弦追,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年毙沾,在試婚紗的時候發(fā)現(xiàn)自己被綠了骗卜。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡左胞,死狀恐怖寇仓,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情烤宙,我是刑警寧澤遍烦,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站躺枕,受9級特大地震影響服猪,放射性物質(zhì)發(fā)生泄漏供填。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一罢猪、第九天 我趴在偏房一處隱蔽的房頂上張望近她。 院中可真熱鬧,春花似錦膳帕、人聲如沸粘捎。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽攒磨。三九已至,卻和暖如春汤徽,著一層夾襖步出監(jiān)牢的瞬間娩缰,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工谒府, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留拼坎,地道東北人。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓完疫,卻偏偏與公主長得像演痒,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子趋惨,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容