可解釋推薦系統(tǒng)工具箱 - ProCE(一)

文章名稱

【Arxiv-2021】【University of Technology Sydney】Prototype-based Counterfactual Explanation for Causal Classification

核心要點(diǎn)

文章旨在解決現(xiàn)有(針對離散特征的)反事實(shí)解釋方法存在的,1)丟失特征間因果關(guān)系黄虱,導(dǎo)致反事實(shí)樣本不合理悬钳;2)生成反事實(shí)樣本速度慢默勾,需調(diào)節(jié)大量參數(shù)母剥,融合多種損失兩方面問題环疼,提出了利用因果結(jié)構(gòu)模型來保留反事實(shí)特征背后的因果關(guān)系,同時設(shè)計(jì)了一種基于多目標(biāo)遺傳算法的新型無梯度優(yōu)化算法為連續(xù)和分類數(shù)據(jù)的混合類型生成反事實(shí)解釋淋叶。

方法細(xì)節(jié)

問題引入

反事實(shí)解釋是可解釋機(jī)器學(xué)習(xí)的一個分支煞檩,通過產(chǎn)生擾動樣本使得模型改變原來決策斟湃,以擾動樣本作為對模型決策依據(jù)的解釋∧現(xiàn)有的反事實(shí)解釋方法大多是基于梯度的方法墓猎,只能優(yōu)化連續(xù)變量陶衅。雖然有許多方法被提出直晨,來對分類變量進(jìn)行反事實(shí)解釋的生成勇皇,但存在兩點(diǎn)不足

  • 在生成反事實(shí)時通常會忽略特征之間的因果關(guān)系敛摘,導(dǎo)致得到的反事實(shí)解釋是不合理的(比如提升學(xué)歷兄淫,但年齡不變)蔓姚,不能幫助決策者采取行動[1, 2]坡脐。
  • 生成反事實(shí)樣本的速度非常慢,需要調(diào)節(jié)大量參數(shù)晌端,并且要組合多種損失函數(shù)[3, 4]咧纠。

具體做法

為了解決上述問題,作者提出了ProCE方法梧奢,其特點(diǎn)包括粹断,

  • 該方法是一種與模型無關(guān)的方法瓶埋,能夠?qū)旌咸卣骺臻g中的分類決策給出解釋诊沪。
  • 該方法結(jié)合因果結(jié)果模型和因果損失函數(shù),可以在生成反事實(shí)樣本時保持特征間因果約束晕粪。
  • 利用自動編碼器模型巫湘,結(jié)合所謂的“類原型”來指導(dǎo)反事實(shí)樣本生成的搜索過程尚氛,并加快搜索速度阅嘶。
  • ProCE利用多目標(biāo)優(yōu)化平衡生成的反事實(shí)樣本的最優(yōu)性和合理性讯柔。

首先护昧,對一些后續(xù)用到的變量進(jìn)行一下形式化定義,

  • 決策模型h: \mathcal{X } \rightarrow \mathcal{Y }极祸,\mathcal{X } \subseteq R^D遥金, \mathcal{Y } \in \{ 0, 1 \}分別表示特征和標(biāo)簽空間,x \in \mathcal{X }表示某一個具體樣本的特征选泻。
  • 為了區(qū)別觀測事實(shí)和反事實(shí)页眯,把觀測樣本特征和標(biāo)簽記作x_0, y_0窝撵。
  • 反事實(shí)樣本生成的目的是碌奉,基于x_0, y_0赐劣,生成反事實(shí)樣本x_{cf}, 使得樣本的預(yù)測結(jié)果y_{cf}變?yōu)槟繕?biāo)標(biāo)簽魁兼。該生成過程一般通過解決如下圖所示的優(yōu)化問題得到漠嵌。其中儒鹿,f 表示 x_0x_{cf} 之間的距離度量函數(shù)。一般為了產(chǎn)生合理的反事實(shí)解釋,要求反事實(shí)樣本與原始樣本在特征空間中的距離要小锌仅。
    optimization problem of counterfactual sample generation

Prototype-based Causal Model

ProCE在反事實(shí)樣本贱傀,要求模型遵循一些約束來伊脓,以此保證樣本取值的合理性,加速反事實(shí)樣本生成速度剖淀。包括纤房,

  • 目標(biāo)標(biāo)簽約束炮姨。分類器對發(fā)說說樣本的預(yù)測距離和期望反事實(shí)結(jié)果要一致舒岸。在分類任務(wù)中,可以利用cross-entropy來度量這個差異俄认,其損失如下圖所示梭依。


    prediction loss
  • 原型約束役拴。巨大的搜索空間河闰,導(dǎo)致反事實(shí)樣本生成運(yùn)算過程很慢。作者受到[5]啟發(fā)髓考,利用“類原型”的概念指導(dǎo)模型在特征空間中搜索氨菇,并得到合理的反事實(shí)樣本查蓉。具體做法是一個意向量空間中尋找x_0的KNN,并以這些KNN的算數(shù)中心(各節(jié)點(diǎn)的平均)妹田」碛叮可以通過投影函數(shù)Q_\phi: \mathcal{X } \rightarrow \mathcal{Z }把原始樣本特征x_0投影到原型空間。在原型空間中利用歐式距離屯烦,找到KNN驻龟,最終某一個類型i的原型proto_i的定義如下圖所示翁狐。
    prototype

    基于此露懒,原型損失定義如下圖所示懈词。
    prototype loss function

    其中,類別j是在原型空間中抠忘,距離原始樣本x_0最近的類原型的標(biāo)號外永,其公式如下圖所示崎脉。
    target class(smallest distance class)

本節(jié)講解了文章研究問題的背景,作者進(jìn)行反事實(shí)樣本生成的思路以及一些反事實(shí)樣本需要遵循的約束伯顶。下一節(jié)繼續(xù)介紹其他約束以及多目標(biāo)損失函數(shù)和優(yōu)化方法

心得體會

反事實(shí)約束

作者的優(yōu)化思路是先把反事實(shí)樣本需要遵循的約束(或者說目標(biāo))羅列清楚囚灼,通過優(yōu)化這些目標(biāo),得到期望的反事實(shí)樣本祭衩。其中灶体,prototype,相當(dāng)于給反事實(shí)樣本生成打錨點(diǎn)汪厨,讓反事實(shí)樣本生成逐漸找到方向赃春,而不是不知道該往哪走(因?yàn)橛锌梢悦闇?zhǔn)任何一個具有目標(biāo)標(biāo)簽的樣本去搜索或者改變特征值)愉择。

也許在原型選取劫乱,也就是KNN中K的設(shè)置過程上,優(yōu)先使用大的K,最終逐漸縮小K刁笙,類似引路的感覺前鹅。

文章引用

[1] Berk Ustun, Alexander Spangher, and Yang Liu. Actionable recourse in linear classification. In Proceedings of the Conference on Fairness, Accountabil- ity, and Transparency, pages 10–19, 2019.

[2] Rafael Poyiadzi, Kacper Sokol, Raul Santos-Rodriguez, Tijl De Bie, and Peter Flach. Face: fea- sible and actionable counterfactual explanations. In Pro- ceedings of the AAAI/ACM Conference on AI, Ethics, and Society, pages 344–350, 2020.

[3] Divyat Mahajan, Chenhao Tan, and Amit Sharma. Preserving causal constraints in counterfactual explanations for machine learning classifiers. arXiv preprint arXiv:1912.03277, 2019.

[4] Ramaravind K Mothilal, Amit Sharma, and Chenhao Tan. Explaining machine learning classifiers through diverse counterfactual explanations. In Proceedings of the 2020 Conference on Fairness, Accountability, and Transparency, pages 607–617, 2020.

[5] Arnaud Van Looveren and Janis Klaise. Interpretable counterfactual explanations guided by prototypes. arXiv preprint arXiv:1907.02584, 2019.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌探膊,老刑警劉巖腌闯,帶你破解...
    沈念sama閱讀 221,576評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件分瘦,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,515評論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蹋肮,“玉大人崩侠,你說我怎么就攤上這事改抡∫穆” “怎么了?”我有些...
    開封第一講書人閱讀 168,017評論 0 360
  • 文/不壞的土叔 我叫張陵刹枉,是天一觀的道長芥吟。 經(jīng)常有香客問我涤躲,道長,這世上最難降的妖魔是什么岂昭? 我笑而不...
    開封第一講書人閱讀 59,626評論 1 296
  • 正文 為了忘掉前任恰矩,我火速辦了婚禮栏豺,結(jié)果婚禮上嚼沿,老公的妹妹穿的比我還像新娘箫踩。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,625評論 6 397
  • 文/花漫 我一把揭開白布师郑。 她就那樣靜靜地躺著菊卷,像睡著了一般。 火紅的嫁衣襯著肌膚如雪弓千。 梳的紋絲不亂的頭發(fā)上总寒,一...
    開封第一講書人閱讀 52,255評論 1 308
  • 那天品洛,我揣著相機(jī)與錄音,去河邊找鬼蔗崎。 笑死,一個胖子當(dāng)著我的面吹牛番官,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播台颠,決...
    沈念sama閱讀 40,825評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼瘫里,長吁一口氣:“原來是場噩夢啊……” “哼劳殖!你這毒婦竟也來了填具?” 一聲冷哼從身側(cè)響起筋量,我...
    開封第一講書人閱讀 39,729評論 0 276
  • 序言:老撾萬榮一對情侶失蹤窿吩,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后错览,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體纫雁,經(jīng)...
    沈念sama閱讀 46,271評論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,363評論 3 340
  • 正文 我和宋清朗相戀三年倾哺,在試婚紗的時候發(fā)現(xiàn)自己被綠了轧邪。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,498評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡悼粮,死狀恐怖闲勺,靈堂內(nèi)的尸體忽然破棺而出曾棕,到底是詐尸還是另有隱情扣猫,我是刑警寧澤,帶...
    沈念sama閱讀 36,183評論 5 350
  • 正文 年R本政府宣布翘地,位于F島的核電站申尤,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏衙耕。R本人自食惡果不足惜昧穿,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,867評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望橙喘。 院中可真熱鬧时鸵,春花似錦、人聲如沸厅瞎。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,338評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽和簸。三九已至彭雾,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間锁保,已是汗流浹背薯酝。 一陣腳步聲響...
    開封第一講書人閱讀 33,458評論 1 272
  • 我被黑心中介騙來泰國打工半沽, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人吴菠。 一個月前我還...
    沈念sama閱讀 48,906評論 3 376
  • 正文 我出身青樓者填,卻偏偏與公主長得像,于是被迫代替她去往敵國和親橄务。 傳聞我的和親對象是個殘疾皇子幔托,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,507評論 2 359

推薦閱讀更多精彩內(nèi)容