校正年齡和性別 | 統(tǒng)計

寫在前面

之前做群體進化琐凭,經(jīng)常會遇到需要考慮群體結(jié)構(gòu)對結(jié)果的影響设江。比如病例組和對照組之間在某個基因上存在差異,病例組在這個基因上突變了炫隶,對照組沒有,剛開始以為是導致該病的原因阎曹。后來發(fā)現(xiàn)病例組是靠近北極的人伪阶,對照組是靠近赤道的人,本來兩組人群在遺傳上的差異就賊拉噠处嫌,這個突變可能是本來就存在的差異栅贴,不一定就是和疾病相關。這時候就需要將地域信息(人種信息)加入熏迹,作為協(xié)變量對結(jié)果進行校正檐薯。(好像扯遠了...)

一般臨床上要找指示疾病的標志物,比如某個基因的表達水平高低是否與疾病相關注暗,也需要對常見的相關因素進行校正坛缕,如年齡和性別墓猎。

是否患病是0和1的游戲,所以這其實是一個binomial logistic regression的問題祷膳。除了擬合度的高低(R2,p-value)陶衅,更應該關注比值比(odd ratio)的大小。OR>1直晨,說明該因素能提高患病風險搀军;OR<1,則認為是保護因素勇皇。

實戰(zhàn)唄

例子文件

###
library(epiDisplay)
library(carData)
data(Wells, package="carData")
head(Wells)
#  switch arsenic distance education association
#1    yes    2.36   16.826         0          no
#2    yes    0.71   47.322         0          no
#3     no    2.07   20.967        10          no

glm1 <- glm(switch~arsenic+distance+education+association,
            family=binomial, data=Wells)
summary(glm1)    #查看相應參數(shù)    
logistic.display(glm1)  #計算OR值
#Logistic regression predicting switch : yes vs no 
 
#                    crude OR(95%CI)         adj. OR(95%CI)         P(Wald's test) P(LR-test)
#arsenic (cont. var.)   1.46 (1.35,1.58)        1.6 (1.47,1.73)        < 0.001        < 0.001 
#distance (cont. var.)  0.9938 (0.9919,0.9957)  0.9911 (0.989,0.9931)  < 0.001        < 0.001  
#education (cont. var.) 1.04 (1.02,1.06)        1.04 (1.02,1.06)       < 0.001        < 0.001  
#association: yes vs no 0.86 (0.75,1)           0.88 (0.76,1.03)       0.106          0.106    
#Log-likelihood = -1953.913
#No. of observations = 3020
#AIC value = 3917.826

pseudo_r2=1-(glm$deviance/glm$null.deviance)   #McFadden's pseudo-R2;不同模型用不同的pseudo-R2

關于pseudo r2罩句,可參考以下描述:

The denominator of the ratio can be thought of as the sum of squared errors from the null model--a model predicting the dependent variable without any independent variables.

了解不同的pseudo_r2 https://web.archive.org/web/20130701052120/http://www.ats.ucla.edu:80/stat/mult_pkg/faq/general/Psuedo_RSquareds.htm

實際數(shù)據(jù)

data<-read.table("adjust_gender_age.inp",header=T)
head(data)
#GROUP AGE SEX T6 T7 T8 T9 
#1     0  48   1 0.06 0.56 0.38 0.74  
#2     0  45   1 0.07 0.95 0.34 0.77  
#3     0  24   1 0.00 0.65 0.40 0.83  

#(T6)binomial logistic regression:要求y必須用0和1來分類 (0<=y<=1)

glm<- glm(GROUP~AGE+SEX+T6,
          family=binomial, data=data)
pseudo_r2=1-(glm$deviance/glm$null.deviance) 
name=cbind(T6,pseudo_r2)
write.table(name,file="glm.out",quote=FALSE,sep="\t",append=TRUE,col.names=FALSE,row.names=FALSE)
or=logistic.display(glm) #計算OR
write.table(or$table,file="glm.out",quote=FALSE,sep="\t",append=TRUE,col.names=FALSE)

輸出結(jié)果如下:

#T6 0.0128045811182196
#AGE (cont. var.)   0.9995 (0.994,1.0051)   0.9996 (0.9941,1.0053)  0.899   0.899
                
#SEX (cont. var.)   0.6 (0.52,0.71)     0.61 (0.52,0.72)    < 0.001 < 0.001
                
#T6 (cont. var.)    6.62 (1.55,28.29)   5.04 (1.17,21.6)    0.03    0.025

從結(jié)果可以看到,在校正AGE和SEX后敛摘,T6在病例和對照組之間的比值比是5.04门烂,說明T6是風險因素,可以提高5倍的患病率(表述的好像不太準確兄淫,大概是這個意思)屯远。

SPSS

SPSS可以很方便地以表格形式輸出結(jié)果,唯一的弊端可能是表格太多捕虽,有時候不清楚看哪個慨丐。這個鏈接內(nèi)容寫得很詳細,供參考 https://www.zhihu.com/question/34502688

寫在最后

發(fā)現(xiàn)自己的統(tǒng)計泄私,真的是渣渣級別啊房揭。許多底層的基礎邏輯和思維嚴重欠缺,不說了晌端,看書去吧捅暴。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市咧纠,隨后出現(xiàn)的幾起案子蓬痒,更是在濱河造成了極大的恐慌,老刑警劉巖漆羔,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件乳幸,死亡現(xiàn)場離奇詭異,居然都是意外死亡钧椰,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進店門符欠,熙熙樓的掌柜王于貴愁眉苦臉地迎上來嫡霞,“玉大人,你說我怎么就攤上這事希柿≌锘Γ” “怎么了养筒?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長端姚。 經(jīng)常有香客問我晕粪,道長,這世上最難降的妖魔是什么渐裸? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任巫湘,我火速辦了婚禮,結(jié)果婚禮上昏鹃,老公的妹妹穿的比我還像新娘尚氛。我一直安慰自己,他們只是感情好洞渤,可當我...
    茶點故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布阅嘶。 她就那樣靜靜地躺著,像睡著了一般载迄。 火紅的嫁衣襯著肌膚如雪讯柔。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天护昧,我揣著相機與錄音魂迄,去河邊找鬼。 笑死捏卓,一個胖子當著我的面吹牛极祸,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播怠晴,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼遥金,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蒜田?” 一聲冷哼從身側(cè)響起稿械,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎冲粤,沒想到半個月后美莫,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡梯捕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年厢呵,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片傀顾。...
    茶點故事閱讀 40,096評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡襟铭,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情寒砖,我是刑警寧澤赐劣,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站哩都,受9級特大地震影響魁兼,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜漠嵌,卻給世界環(huán)境...
    茶點故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一咐汞、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧献雅,春花似錦碉考、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至章钾,卻和暖如春墙贱,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背贱傀。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工惨撇, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人府寒。 一個月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓魁衙,卻偏偏與公主長得像,于是被迫代替她去往敵國和親株搔。 傳聞我的和親對象是個殘疾皇子剖淀,可洞房花燭夜當晚...
    茶點故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內(nèi)容