因果模型訓(xùn)練步驟

Meta-learners (Reference)

SLeaner

  • 訓(xùn)練集將原Treatment列當(dāng)作特征和特征集\{X_i\}合并訓(xùn)練一個(gè)Single Model做葵。
  • 測(cè)試集中生成新的兩列弧满,一列Treatment,值為1仙蚜,另一列Control肛捍,值為0相种,隨后這兩列分別和特征集\{X_i\}合并己沛,用Single Model預(yù)測(cè)出兩列分別為E[Y|X=x, T=1]E[Y|X=x, T=0]臂拓。
  • 估計(jì)的CATE為兩列的差:
    \hat{\tau}(x)=E[Y|X=x, T=1]-E[Y|X=x, T=0]

TLearner

  • 訓(xùn)練集根據(jù)Treatment的值分為兩個(gè)樣本集,一個(gè)處理組樣本集缘薛,一個(gè)控制組樣本集窍育,針對(duì)兩個(gè)樣本集分別訓(xùn)練兩個(gè)模型Model_treatment,Model_control宴胧。
  • 測(cè)試集分別使用Model_treatment和Model_control預(yù)測(cè)出兩列漱抓,分別為E[Y(1)|X=x]E[Y(0)|X=x]
  • 估計(jì)的CATE為兩列的差:
    \hat{\tau}(x)=E[Y(1)|X=x]-E[Y(0)|X=x]=E[Y(1)-Y(0)|X=x]

XLearner

  • 訓(xùn)練集根據(jù)Treatment的值分為兩個(gè)樣本集恕齐,一個(gè)處理組樣本集乞娄,一個(gè)控制組樣本集,針對(duì)兩個(gè)樣本集分別訓(xùn)練兩個(gè)模型Model_treatment显歧,Model_control仪或。
  • 在全訓(xùn)練集上分別使用Model_treatment和Model_control預(yù)測(cè)出兩列,分別為E[Y(1)|X=x]E[Y(0)|X=x]士骤,計(jì)算殘差列范删。如果樣本Treatment列為1,則用實(shí)際值減預(yù)測(cè)值拷肌,如果樣本Treatment列為0到旦,則用預(yù)測(cè)值減實(shí)際值:
    D_i^1=Y_i^1-E[Y(1)|X=x] \\ D_i^0=E[Y(0)|X=x]-Y_i^0
  • 將殘差列作為新的標(biāo)簽,再次根據(jù)Treatment的值分為兩個(gè)樣本集巨缘,一個(gè)處理組樣本集添忘,一個(gè)控制組樣本集,針對(duì)兩個(gè)樣本集分別訓(xùn)練兩個(gè)模型Residual_model_treatment若锁,Residual_model_control搁骑。
  • 測(cè)試集分別使用Residual_model_treatment和Residual_model_control預(yù)測(cè)出兩列,分別為E[D(1)|X=x]E[D(0)|X=x]又固。
  • 估計(jì)的CATE為兩列的差:
    \hat{\tau}(x)=g(x)E[D(0)|X=x]+(1-g(x))E[D(1)|X=x]
    g(x) 為propensity score仲器。

RLearners

RLearner (Reference)

  • 訓(xùn)練集確定好兩列:Outcome和Treatment,分別以該兩列為標(biāo)簽訓(xùn)練兩個(gè)模型(根據(jù)值的類型確定使用分類模型還是回歸模型)仰冠,model_y和model_t娄周。
  • 在訓(xùn)練集中分別使用model_y和model_t預(yù)測(cè)出兩列,分別為E[Y|X=x]E[T|X=x]沪停,各自計(jì)算殘差列:
    Residual = Y-E[Y|X=x] \\ Propensity = T-E[T|X=x] \\
  • 根據(jù)以上兩殘差列生成殘差標(biāo)簽Residual\_target和權(quán)重weight:
    Residual\_target = Residual/Propensity \\ Weight = Propensity^2 \\
  • 在訓(xùn)練集中以Residual\_target為標(biāo)簽煤辨,權(quán)重列為weight,訓(xùn)練回歸模型木张,并在測(cè)試集中進(jìn)行預(yù)測(cè)众辨,得到的預(yù)測(cè)值即為估計(jì)的CATE。

Doubly Robust Learner (Reference)

  • 訓(xùn)練集確定好兩列:Outcome和Treatment舷礼,分別訓(xùn)練兩個(gè)模型model_regression(回歸模型)和model_propensity(分類模型)鹃彻。其中,model_regression以特征集\{X_i\}和Treatment為輸入妻献,以O(shè)utcome為輸出進(jìn)行訓(xùn)練蛛株,model_propensity以特征集\{X_i\}為輸入团赁,以Treatment為輸出進(jìn)行訓(xùn)練。

  • 使用model_propensity分別預(yù)測(cè)出Treatment和Control的傾向得分值谨履,分別為Pr[T_i=t|X_i]Pr[T_i=0|X_i]欢摄。(注:傾向得分Propensity可能會(huì)出現(xiàn)0的情況,可用 \varepsilon=10^{-6} 進(jìn)行替代笋粟。)

  • 在訓(xùn)練集中生成新的兩列怀挠,一列Treat_value,值為1害捕,另一列Control_value绿淋,值為0。在訓(xùn)練集中將Treat_value尝盼、Control_value列分別和特征集\{X_i\}合并吞滞,使用model_regression預(yù)測(cè)出Treatment和Control的Predicted Outcome,分別為E[Y|X_i, T_i=t]E[Y|X_i, T_i=0]盾沫。

  • 根據(jù)以上兩列傾向得分和兩列預(yù)測(cè)值分別計(jì)算Y_{i,t}^{DR}Y_{i,0}^{DR}:
    Y_{i,t}^{DR}=E[Y|X_i, T_i=t]+\frac{Y_i-E[Y|X_i, T_i=t]}{Pr[T_i=t|X_i]} \cdot 1\{T_i=t\} \\ Y_{i,0}^{DR}=E[Y|X_i, T_i=0]+\frac{Y_i-E[Y|X_i, T_i=0]}{Pr[T_i=0|X_i]} \cdot 1\{T_i=0\}

  • 在訓(xùn)練集中以特征集\{X_i\}為輸入冯吓,以Y_{i,t}^{DR}-Y_{i,0}^{DR}為輸出,訓(xùn)練回歸模型model_final疮跑,并在測(cè)試集中進(jìn)行預(yù)測(cè)组贺,得到的預(yù)測(cè)值即為估計(jì)的CATE。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末祖娘,一起剝皮案震驚了整個(gè)濱河市失尖,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌渐苏,老刑警劉巖掀潮,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異琼富,居然都是意外死亡仪吧,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門鞠眉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來薯鼠,“玉大人,你說我怎么就攤上這事械蹋〕龌剩” “怎么了?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵哗戈,是天一觀的道長(zhǎng)郊艘。 經(jīng)常有香客問我,道長(zhǎng),這世上最難降的妖魔是什么纱注? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任畏浆,我火速辦了婚禮,結(jié)果婚禮上狞贱,老公的妹妹穿的比我還像新娘刻获。我一直安慰自己,他們只是感情好斥滤,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著勉盅,像睡著了一般佑颇。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上草娜,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天挑胸,我揣著相機(jī)與錄音,去河邊找鬼宰闰。 笑死茬贵,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的移袍。 我是一名探鬼主播解藻,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼葡盗!你這毒婦竟也來了螟左?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤觅够,失蹤者是張志新(化名)和其女友劉穎胶背,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體喘先,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡钳吟,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了窘拯。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片红且。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖涤姊,靈堂內(nèi)的尸體忽然破棺而出直焙,到底是詐尸還是另有隱情,我是刑警寧澤砂轻,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布奔誓,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏厨喂。R本人自食惡果不足惜和措,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望蜕煌。 院中可真熱鬧派阱,春花似錦、人聲如沸斜纪。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)盒刚。三九已至腺劣,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間因块,已是汗流浹背橘原。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留涡上,地道東北人趾断。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像吩愧,于是被迫代替她去往敵國(guó)和親芋酌。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容