風(fēng)控(四)——單變量分析

作為一個(gè)剛?cè)胄械臄?shù)據(jù)分析職場(chǎng)小白呼畸,老板是不會(huì)讓你直接去做模型的痕支,很可能你的老板會(huì)跟你說(shuō):“小白啊,你去給我研究一下星座對(duì)我們是否貸款有沒(méi)有影響”蛮原。雖然你腦袋上已經(jīng)出現(xiàn)一百個(gè)問(wèn)號(hào)卧须,但是老板交代的任務(wù)還是得去好好完成以下。
先導(dǎo)入包

import pandas as pd
import numpy as np

讀入數(shù)據(jù)

f = open('ft_zodiac.txt', encoding='utf-8')
ft_zodiac = pd.read_csv(f)  
print(ft_zodiac.shape)
ft_zodiac.head()

數(shù)據(jù)維度為(23519, 4)



一般在實(shí)際業(yè)務(wù)中儒陨,我們并不會(huì)設(shè)定一個(gè)明確的界線來(lái)分割好壞客戶花嘶。比如一般的中短期借貸中會(huì)認(rèn)為逾期15天以上算壞客戶,但其實(shí)逾期14天和15天的客戶差別很難區(qū)分蹦漠。因?yàn)橥衷保瑢?shí)際業(yè)務(wù)中會(huì)留有一個(gè)“灰色地帶”。比如定義逾期15天以上的為壞客戶笛园,逾期5天以內(nèi)的為好客戶隘击,逾期6-14天的則定義為“灰色地帶”,也就是其實(shí)是分成0,1,2三類的研铆。
去掉“灰色地帶”的數(shù)據(jù)

l = open('zodiac_label.txt')
zodiac_label=pd.read_csv(l)

ft_label = zodiac_label[zodiac_label['label'] != 2]
ft_label.head()

將特征表和標(biāo)簽表合并

data = pd.merge(ft_label,ft_zodiac,on = 'order_id',how = 'inner')
data.head()

計(jì)算星座壞客戶比例:badrate = bad/toal

#星座
zodiac_badrate = {}
for x in zodiac_list:
    
    a = data[data.zodiac == x]
    
    bad = a[a.label == 1]['label'].count()
    good = a[a.label == 0]['label'].count()
    
    zodiac_badrate[x] = bad/(bad+good)

f = zip(zodiac_badrate.keys(),zodiac_badrate.values())
f = sorted(f,key = lambda x : x[1],reverse = True )
zodiac_badrate = pd.DataFrame(f)
zodiac_badrate.columns = pd.Series(['星座','badrate'])
zodiac_badrate

將星座壞客戶比例可視化

from pyecharts import Line
x = zodiac_badrate['星座']
y = zodiac_badrate['badrate']
line = Line('星座')
line.add(1,x,y)

壞客戶比例最高的雙魚(14%)與最低的天蝎(12%)之間差別是非常小的埋同,所以星座這個(gè)變量可以說(shuō)是作用不大。
那我們?cè)賮?lái)看看生肖蚜印。

#生肖
chinese_zodiac_badrate = {}
for x in chinese_zodiac_list:
    
    a = data[data.chinese_zodiac == x]
    
    bad = a[a.label == 1]['label'].count()
    good = a[a.label == 0]['label'].count()
    
    chinese_zodiac_badrate[x] = bad/(bad+good)

f = zip(chinese_zodiac_badrate.keys(),chinese_zodiac_badrate.values())
f = sorted(f,key = lambda x : x[1],reverse = True )
chinese_zodiac_badrate = pd.DataFrame(f)
chinese_zodiac_badrate.columns = pd.Series(['生肖','badrate'])
chinese_zodiac_badrate
from pyecharts import Line
x = chinese_zodiac_badrate['生肖']
y = chinese_zodiac_badrate['badrate']
line = Line('生肖')
line.add(1,x,y)

可以看到,壞客戶率最高的“帕袅浚”(16%)與“狗”(11%)之間的差異還是比“星座”大的窄赋,所以可以說(shuō)可能研究“生肖”這個(gè)特征是比研究“星座”這個(gè)特征意義更大的哟冬。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市忆绰,隨后出現(xiàn)的幾起案子浩峡,更是在濱河造成了極大的恐慌,老刑警劉巖错敢,帶你破解...
    沈念sama閱讀 212,718評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件翰灾,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡稚茅,警方通過(guò)查閱死者的電腦和手機(jī)纸淮,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,683評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)亚享,“玉大人咽块,你說(shuō)我怎么就攤上這事∑鬯埃” “怎么了侈沪?”我有些...
    開封第一講書人閱讀 158,207評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)晚凿。 經(jīng)常有香客問(wèn)我亭罪,道長(zhǎng),這世上最難降的妖魔是什么歼秽? 我笑而不...
    開封第一講書人閱讀 56,755評(píng)論 1 284
  • 正文 為了忘掉前任应役,我火速辦了婚禮,結(jié)果婚禮上哲银,老公的妹妹穿的比我還像新娘扛吞。我一直安慰自己,他們只是感情好荆责,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,862評(píng)論 6 386
  • 文/花漫 我一把揭開白布滥比。 她就那樣靜靜地躺著,像睡著了一般做院。 火紅的嫁衣襯著肌膚如雪盲泛。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 50,050評(píng)論 1 291
  • 那天键耕,我揣著相機(jī)與錄音寺滚,去河邊找鬼。 笑死屈雄,一個(gè)胖子當(dāng)著我的面吹牛村视,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播酒奶,決...
    沈念sama閱讀 39,136評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼蚁孔,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼奶赔!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起杠氢,我...
    開封第一講書人閱讀 37,882評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤站刑,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后鼻百,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體绞旅,經(jīng)...
    沈念sama閱讀 44,330評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,651評(píng)論 2 327
  • 正文 我和宋清朗相戀三年温艇,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了因悲。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,789評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡中贝,死狀恐怖囤捻,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情邻寿,我是刑警寧澤蝎土,帶...
    沈念sama閱讀 34,477評(píng)論 4 333
  • 正文 年R本政府宣布,位于F島的核電站绣否,受9級(jí)特大地震影響誊涯,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蒜撮,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,135評(píng)論 3 317
  • 文/蒙蒙 一暴构、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧段磨,春花似錦取逾、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,864評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至债蜜,卻和暖如春晴埂,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背寻定。 一陣腳步聲響...
    開封第一講書人閱讀 32,099評(píng)論 1 267
  • 我被黑心中介騙來(lái)泰國(guó)打工儒洛, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人狼速。 一個(gè)月前我還...
    沈念sama閱讀 46,598評(píng)論 2 362
  • 正文 我出身青樓琅锻,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子恼蓬,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,697評(píng)論 2 351

推薦閱讀更多精彩內(nèi)容

  • 1.transition需要進(jìn)行過(guò)渡/動(dòng)畫處理的元素沫浆,用 標(biāo)簽嵌套,在css過(guò)渡和動(dòng)畫中自動(dòng)應(yīng)用相關(guān)的class類...
    nora_wang閱讀 191評(píng)論 0 0
  • 客棧二號(hào)店和一號(hào)店風(fēng)格完全不同淮捆。二號(hào)店是比較典型的瑞士鄉(xiāng)村風(fēng)格郁油,因?yàn)閮蓚€(gè)主要師傅都是在酒店行業(yè)工作過(guò)二十多年的老師...
    瑞士農(nóng)兒客棧大掌柜閱讀 6,278評(píng)論 0 1
  • 2018年已經(jīng)過(guò)去1/6了。 不知道大家有沒(méi)有一種攀痊,時(shí)間不知不覺的過(guò)去桐腌,年初許下的愿望,立下的flag還遙遙無(wú)期的...
    一只奔跑的冰淇淋閱讀 977評(píng)論 0 6
  • 每一天的生活中苟径,總能遇見和接受各種各樣的善意案站,來(lái)自親人,朋友甚至陌生人棘街。也許對(duì)他們來(lái)說(shuō)蟆盐,只是舉手之勞,微乎其微遭殉,但...
    小宇老師_閱讀 889評(píng)論 7 14