R中完成PSM绪妹，CBPS柿究，IPTW，Doubly robust estimation總結(jié)

前段時(shí)間在幫女朋友做基于MIMICIII的臨床數(shù)據(jù)分析蝇摸，需要用到傾向性分析办陷，下面總結(jié)一下個(gè)人在這個(gè)過(guò)程中積累的知識(shí)和學(xué)習(xí)的R包律歼。
1.什么是傾向性分析：
2.PSM，CBPS制圈，IPTW畔况，DR的聯(lián)系與區(qū)別
3.具體的實(shí)現(xiàn)過(guò)程：PSM,CBPS,IPTW,DR
4.總結(jié)

一、什么是傾向性分析：

在醫(yī)學(xué)研究中跷跪，我們常常需要研究某種treatment如新藥，新手術(shù)葛菇，對(duì)于outcome如死亡率的影響效果橡羞，最常使用的方法就是隨機(jī)試驗(yàn)（randomized controlled trials (RCTs)），通過(guò)隨機(jī)抽取實(shí)驗(yàn)個(gè)體控制變量尉姨，從而達(dá)到研究目的。隨機(jī)對(duì)照實(shí)驗(yàn)?zāi)軌蜃畲笙薅鹊亟档推渌茄芯恳蛩貙?duì)實(shí)驗(yàn)結(jié)果的干擾，比如研究某一種新藥降低死亡率的效果時(shí)椎瘟，病人的年齡，性別煌妈，BMI宣羊，基礎(chǔ)疾病的患病情況，都會(huì)影響死亡率仇冯，這就會(huì)干擾我們對(duì)于這款新藥效果的判斷，通過(guò)隨機(jī)對(duì)照實(shí)驗(yàn)可以盡可能地保證這些非研究因素的隨機(jī)分布比被，這樣實(shí)驗(yàn)組和對(duì)照組就只收到研究因素的影響。
能夠進(jìn)行隨機(jī)實(shí)驗(yàn)當(dāng)然是最好的等缀，但有時(shí)候沒(méi)有這個(gè)條件進(jìn)行，大樣本的隨機(jī)試驗(yàn)要耗費(fèi)大量人力物力笤妙。對(duì)于新藥研發(fā)過(guò)程中的臨床實(shí)驗(yàn)來(lái)說(shuō)噪裕，隨機(jī)雙盲實(shí)驗(yàn)時(shí)必不可少的，也是不可能被別的什么方式替代的州疾，但是，如果是研究一些目前已經(jīng)被廣泛使用的藥物或者手術(shù)的效果薄嫡，就有著足夠多的詳細(xì)的臨床資料。這些病人的數(shù)據(jù)產(chǎn)生自普通的治療過(guò)程毫深，并沒(méi)有帶著任何研究的目的去控制毒姨，因此，當(dāng)你手上有1000個(gè)病人的臨床數(shù)據(jù)闸迷，你想研究心電圖檢測(cè)對(duì)于冠心病的預(yù)后影響時(shí)俘枫，你不可能簡(jiǎn)單地直接對(duì)比1000個(gè)病人中男性和女性冠心病患者的28天死亡率或者其他指標(biāo)，因?yàn)檫@些病人的其他非研究因素比如年齡還有基礎(chǔ)疾病患病情況都不一定是隨機(jī)分布的鸠蚪，這樣的比較并不符合控制變量的思想。但是盾舌，如果我們仔細(xì)挑選，從1000個(gè)病人里妖谴，挑出非研究因素基本相似的病人棚贾，然后再用這群病人的臨床資料進(jìn)行研究榆综，就能大大降低非研究因素（協(xié)變量：covariates铸史；混雜因素：confounding factors）對(duì)于結(jié)果的影響。
由Rosenbaum和Rubin定義的傾向評(píng)分（Propensity score）是根據(jù)其他混雜因素的水平計(jì)算出來(lái)的接受某種治療（通常就是你研究的treatment）的概率判沟。簡(jiǎn)而言之我們把一個(gè)病人的混雜因素看作他們的基礎(chǔ)特征崭篡，通過(guò)這個(gè)基礎(chǔ)特征計(jì)算出一個(gè)score，有著相近score的病人就有著相似的基礎(chǔ)特征琉闪，就可以看兩個(gè)或多個(gè)病人被控制變量了。
用學(xué)術(shù)的語(yǔ)言來(lái)說(shuō)斯入，就是：

Propensity score (PS), as defined by Rosenbaum and Rubin, is the probability of receiving certain treatments, conditional on observed baseline covariates (6), and is estimated by using modeling to predict treatment allocation with covariates. In simple terms, PSA is based on the hypothesis that two patients with similar PSs have covariates which come from similar distributions. This means that by selecting or reweighting samples based on PS, researchers create new datasets where covariates are similar between treatment and control groups.

二蛀蜜、machit包進(jìn)行傾向性評(píng)分匹配（PSM）

傾向性分析的方法包括：matching, weighting, stratification, covariate adjustment. 這里我要分享的是傾向性分?jǐn)?shù)匹配：PSM（propensity score matching）。

The framework of propensity score matching

data("nhanes")#survey包的自帶數(shù)據(jù)集
#machit的使用可以參照知乎回答：https://zhuanlan.zhihu.com/p/145170602
# recode the "treatment" (male) to a 0/1 indicator
nhanes$male <- as.numeric(nhanes$RIAGENDR==1)#這就是我們的treatment
nhanes$male <- as.factor(nhanes$male)
# make "race" a factor with descriptive labels
nhanes$race <- factor(nhanes$race,
                      levels=c(1,2,3,4),
                      labels=c("Hispanic","non-Hispanic white",
                               "non-Hispanic black","other"))
psm<-matchit(male~race+agecat,#格式：treatment~covariate1+covariate2+...+covariate2n
             data=nhanes, method="nearest",distance = "glm", #這里使用的model是“Nearest neighbor matching”磅摹，The default is "glm" for propensity scores estimated with logistic regression using glm(). 
             link = "probit",caliper = 0.2,ratio = 1)
mchdata <- match.data(psm)#匹配后的數(shù)據(jù)
tabmchdata <- CreateTableOne(vars = colnames(mchdata),strata = "male",data = mchdata,
                             factorVars = c("agecat","race","subclass","male"),test = T,smd = T)
print(tabmchdata,smd=T)

需要說(shuō)明的是caliper值霎奢，也就是卡鉗值。類似于給每個(gè)病人設(shè)定一個(gè)范圍厅克，超出這個(gè)范圍后就算某一個(gè)病人的PS與這個(gè)病人的PS是最接近的橙依，也不會(huì)匹配成功硕旗。可見下圖：

caliper

Red color is used for emphasis, and the red cross on the arrow means that matching will not be made as a result of the specified caliper.
如果需要計(jì)算HR或者OR漆枚，可以參考http://www.reibang.com/p/6486d2466044

HI_chol <- mchdata$HI_CHOL
glmmatched <- glm(formula = (HI_chol == 1) ~ male,
                    family  = binomial(link = "logit"),
                    data    = mchdata)
print(ShowRegTable(glmmatched, printToggle = FALSE), quote = FALSE)

未完待續(xù)墙基。刷喜。立砸。

最后編輯于：2022.03.21 18:36:49

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市颗祝，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌搁宾，老刑警劉巖倔幼，帶你破解...
沈念sama閱讀 206,126評(píng)論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異损同，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)栗菜，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,254評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門蹄梢，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人而咆，你說(shuō)我怎么就攤上這事幕袱。” “怎么了们豌？”我有些...
開封第一講書人閱讀 152,445評(píng)論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)障癌。經(jīng)常有香客問(wèn)我辩尊，道長(zhǎng)，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,185評(píng)論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任疮薇，我火速辦了婚禮我注，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘仓手。我一直安慰自己墨缘，他們只是感情好猴抹，可當(dāng)我...
茶點(diǎn)故事閱讀 64,178評(píng)論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開白布贰您。她就那樣靜靜地躺著逛钻，像睡著了一般雨女。火紅的嫁衣襯著肌膚如雪阳准。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 48,970評(píng)論 1贊 284
城市分裂傳說(shuō)
那天野蝇，我揣著相機(jī)與錄音，去河邊找鬼锐想。笑死乍狐，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的浅蚪。我是一名探鬼主播，決...
沈念sama閱讀 38,276評(píng)論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼耘戚，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼操漠！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起浊伙，我...
開封第一講書人閱讀 36,927評(píng)論 0贊 259
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤嚣鄙，失蹤者是張志新（化名）和其女友劉穎吻贿，沒(méi)想到半個(gè)月后哑子，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 43,400評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡帐要，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,883評(píng)論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年弥奸，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片赠橙。...
茶點(diǎn)故事閱讀 37,997評(píng)論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡愤炸，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出规个，到底是詐尸還是另有隱情，我是刑警寧澤枉侧，帶...
沈念sama閱讀 33,646評(píng)論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布狂芋，位于F島的核電站，受9級(jí)特大地震影響帜矾，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜屡萤，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,213評(píng)論 3贊 307
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一死陆、第九天我趴在偏房一處隱蔽的房頂上張望唧瘾。院中可真熱鬧，春花似錦饰序、人聲如沸规哪。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,204評(píng)論 0贊 19
一樁弒父案诉稍，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至蚤告，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間罩缴，已是汗流浹背层扶。一陣腳步聲響...
開封第一講書人閱讀 31,423評(píng)論 1贊 260
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留镜会，地道東北人。一個(gè)月前我還...
沈念sama閱讀 45,423評(píng)論 2贊 352
代替公主和親
正文我出身青樓桶至，卻偏偏與公主長(zhǎng)得像匾旭，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子价涝，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,722評(píng)論 2贊 345

R中完成PSM，CBPS愕撰，IPTW，Doubly robust estimation總結(jié)

R中完成PSM绪妹，CBPS柿究，IPTW，Doubly robust estimation總結(jié)

一、什么是傾向性分析：

二蛀蜜、machit包進(jìn)行傾向性評(píng)分匹配（PSM）

推薦閱讀更多精彩內(nèi)容