評分卡之woe轉換

什么是WOE

WOE(Weight of Evidence)即證據(jù)權重盏道,可以將logistic回歸模型轉化為標準評分卡格式,WOE是對原始自變量的一種編碼形式雇锡,要對一個變量進行WOE編碼,需要首先把這個變量進行分組處理(也叫離散化渠概、分箱)锦亦。
WOE的公式就是:WOE=ln(好客戶占比/壞客戶占比)×100%=優(yōu)勢比
下面舉例說明:

woe計算

我們把這個變量離散化為了4個分段:<100元舶替,[100,200),[200,500)杠园,>=500元顾瞪,并分別計算了每組的woe值,重計算數(shù)據(jù)可知:

  • 當前分組中抛蚁,響應的比例越大陈醒,WOE值越大
  • 當前分組WOE的正負,由當前分組響應和未響應的比例篮绿,與樣本整體響應和未響應的比例的大小關系決定孵延,當前分組的比例小于樣本整體比例時吕漂,WOE為負亲配,當前分組的比例大于整體比例時,WOE為正惶凝,當前分組的比例和整體比例相等時吼虎,WOE為0。

為什么做woe轉換

首先明確woe轉換并不一定能顯著提高模型質量苍鲜,建立評分卡也可以不采用woe思灰,這種情況下logistic回歸需要處理更大數(shù)量的自變量,盡管這樣會增加建模的復雜性混滔,但最終得到的評分卡都是一樣的洒疚。即便如此,woe轉換依舊有很多的優(yōu)勢:

  1. woe能反映自變量的貢獻情況
    自變量內部WOE值的變異(波動)情況坯屿,結合模型擬合出的系數(shù)油湖,構造出各個自變量的貢獻率及相對重要性。一般地领跛,系數(shù)越大乏德,woe的方差越大,則自變量的貢獻率越大吠昭。
  2. 標準化功能
    WOE編碼之后喊括,自變量其實具備了某種標準化的性質,也就是說矢棚,自變量內部的各個取值之間都可以直接進行比較(WOE之間的比較)郑什,而不同自變量之間的各種取值也可以通過WOE進行直接的比較。
  3. 對異常值不敏感
    很多極值變量通過WOE可以變?yōu)榉钱惓V灯牙撸芏囝l次較少的變量也可以通過woe轉換進行合并蘑拯。

通過woe轉化劫拢,極大的提高了數(shù)據(jù)的可理解性,這對評分卡模型很重要强胰。WOE其實描述了變量當前這個分組舱沧,對判斷個體是否會響應(或者說屬于哪個類)所起到影響方向和大小,當WOE為正時偶洋,變量當前取值對判斷個體是否會響應起到的正向的影響熟吏,當WOE為負時,起到了負向影響玄窝。而WOE值的大小牵寺,則是這個影響的大小的體現(xiàn)。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末恩脂,一起剝皮案震驚了整個濱河市帽氓,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌俩块,老刑警劉巖黎休,帶你破解...
    沈念sama閱讀 211,948評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異玉凯,居然都是意外死亡势腮,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,371評論 3 385
  • 文/潘曉璐 我一進店門漫仆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來捎拯,“玉大人,你說我怎么就攤上這事盲厌∈鹫眨” “怎么了?”我有些...
    開封第一講書人閱讀 157,490評論 0 348
  • 文/不壞的土叔 我叫張陵吗浩,是天一觀的道長建芙。 經常有香客問我,道長拓萌,這世上最難降的妖魔是什么岁钓? 我笑而不...
    開封第一講書人閱讀 56,521評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮微王,結果婚禮上屡限,老公的妹妹穿的比我還像新娘。我一直安慰自己炕倘,他們只是感情好钧大,可當我...
    茶點故事閱讀 65,627評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著罩旋,像睡著了一般啊央。 火紅的嫁衣襯著肌膚如雪眶诈。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,842評論 1 290
  • 那天瓜饥,我揣著相機與錄音逝撬,去河邊找鬼。 笑死乓土,一個胖子當著我的面吹牛宪潮,可吹牛的內容都是我干的。 我是一名探鬼主播趣苏,決...
    沈念sama閱讀 38,997評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼狡相,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了食磕?” 一聲冷哼從身側響起尽棕,我...
    開封第一講書人閱讀 37,741評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎彬伦,沒想到半個月后滔悉,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 44,203評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡媚朦,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,534評論 2 327
  • 正文 我和宋清朗相戀三年氧敢,在試婚紗的時候發(fā)現(xiàn)自己被綠了日戈。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片询张。...
    茶點故事閱讀 38,673評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖浙炼,靈堂內的尸體忽然破棺而出份氧,到底是詐尸還是另有隱情,我是刑警寧澤弯屈,帶...
    沈念sama閱讀 34,339評論 4 330
  • 正文 年R本政府宣布蜗帜,位于F島的核電站,受9級特大地震影響资厉,放射性物質發(fā)生泄漏厅缺。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,955評論 3 313
  • 文/蒙蒙 一宴偿、第九天 我趴在偏房一處隱蔽的房頂上張望湘捎。 院中可真熱鬧,春花似錦窄刘、人聲如沸窥妇。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,770評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽活翩。三九已至烹骨,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間材泄,已是汗流浹背沮焕。 一陣腳步聲響...
    開封第一講書人閱讀 32,000評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留拉宗,地道東北人遇汞。 一個月前我還...
    沈念sama閱讀 46,394評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像簿废,于是被迫代替她去往敵國和親空入。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,562評論 2 349

推薦閱讀更多精彩內容