Python Pandas 選出指定類型的所有列,統(tǒng)計(jì)列的各個(gè)類型的數(shù)量并用于探索性數(shù)據(jù)分析(附數(shù)據(jù)與源碼)

在這里插入圖片描述

更多包含豐富源數(shù)據(jù)源代碼的 Pandas 高階操作熟掂,數(shù)據(jù)可視化缎浇,以及商業(yè)數(shù)據(jù)分析實(shí)戰(zhàn)案例,盡在公眾號(hào) “ 數(shù)據(jù)分析與商業(yè)實(shí)踐

通過(guò)本文赴肚,你將知曉如何利用 Pandas 選出指定類型的所有列用于后續(xù)的探索性數(shù)據(jù)分析素跺,這個(gè)方法在處理大表格時(shí)非常有用(如列非常多的金融類數(shù)據(jù)),如果能夠較好的掌握精髓誉券,將能大大提升數(shù)據(jù)評(píng)估與清洗的能力指厌,為后續(xù)建模提供高質(zhì)量的數(shù)據(jù)。

這個(gè)技巧并沒(méi)有什么原理性的東西横朋,所以這里直接呈現(xiàn)代碼仑乌。



數(shù)據(jù)讀入

在這里插入圖片描述

統(tǒng)計(jì)列的各個(gè)類型的數(shù)量

在這里插入圖片描述

選出類型為 object 的所有列

在機(jī)器學(xué)習(xí)與數(shù)學(xué)建模中,數(shù)據(jù)類型為 float 或者 int 的才好放入模型琴锭,像下圖這樣含有不少雜音的可不是我們想要的晰甚。當(dāng)然,include=["int", "float"] 便表示選出這兩個(gè)類型的所有列决帖,你可以自行舉一反三厕九。


在這里插入圖片描述

對(duì) object 列們進(jìn)行探索性數(shù)據(jù)分析

在這里插入圖片描述

在這里插入圖片描述

通過(guò)打印出來(lái)的信息,我們可以很快知道每一個(gè) object 列大概需要怎么清洗地回,但許多優(yōu)秀的數(shù)據(jù)分析師并不會(huì)馬上著手操作扁远,而是都先記錄下來(lái),最后再一起操作刻像,畢竟可能有可以復(fù)用的代碼或可以批量進(jìn)行的快捷操作??

這是筆者在進(jìn)行金融數(shù)據(jù)分析清洗時(shí)的記錄(根據(jù)上面的步驟后發(fā)現(xiàn)的需要對(duì) object 類型列進(jìn)行的操作)

  • terms:字符串 month 去掉畅买,可能需要適當(dāng)?shù)姆窒?/li>
  • int_rate(interesting rate):去掉百分號(hào)
  • emp_length:工作年限混入了 <,+ 等無(wú)關(guān)字符串细睡,如 10+谷羞,<1 years 等,需要 先 replace 然后再 map 或者 apply 替換一下
  • title: 該列分類太多溜徙,快兩萬(wàn)湃缎,占到了數(shù)據(jù)集的 2/3,查找一些業(yè)務(wù)看看是否屬于需要?jiǎng)h去的無(wú)關(guān)變量
  • addr_state:地址變量雖然只有 50 個(gè)分類蠢壹,但似乎也無(wú)太大作用嗓违,探究刪去
  • earliest_cr_time:該列有 526 各類,可能需要根據(jù)業(yè)務(wù)知識(shí)進(jìn)行離散化分箱
  • home_ownership:房屋所有情況图贸,全款支付了的給個(gè)1蹂季,其余的都給 0
  • 未完待續(xù).....

先列出來(lái)再統(tǒng)一操作的好處是當(dāng)發(fā)現(xiàn)處理錯(cuò)誤或者需要更改方法時(shí)冕广,還能快速找到自己當(dāng)時(shí)的思路。

在這里插入圖片描述

更多包含豐富源數(shù)據(jù)源代碼的 Pandas 高階操作乏盐,數(shù)據(jù)可視化佳窑,以及商業(yè)數(shù)據(jù)分析的原理+實(shí)戰(zhàn)案例,盡在公眾號(hào) “ 數(shù)據(jù)分析與商業(yè)實(shí)踐

Pandas 的技巧看似瑣碎父能,但積累到一定程度后,便可以發(fā)現(xiàn)許多技巧都存在共通之處净神。小事情重復(fù)做也會(huì)成為大麻煩何吝,所以高手都懂得分類處理。

貫通了 3 個(gè)核心鹃唯,我們才能省時(shí)省事爱榕,成為別人眼中的高手:

  • 大量重復(fù)的工作懂得批處理。
  • 反復(fù)要做的固定操作固化成 " 模板 “坡慌,” 套路 "黔酥。
  • 碰到異常情況,知道準(zhǔn)確高效的解決洪橘。


[圖片上傳失敗...(image-305b72-1596202496513)]

后續(xù)會(huì)陸續(xù)更新 Python 場(chǎng)景實(shí)踐的原理與代碼實(shí)戰(zhàn)


在這里插入圖片描述
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末跪者,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子熄求,更是在濱河造成了極大的恐慌渣玲,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,734評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件弟晚,死亡現(xiàn)場(chǎng)離奇詭異忘衍,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)卿城,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門(mén)枚钓,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人瑟押,你說(shuō)我怎么就攤上這事搀捷。” “怎么了勉耀?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,133評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵指煎,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我便斥,道長(zhǎng)至壤,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,532評(píng)論 1 293
  • 正文 為了忘掉前任枢纠,我火速辦了婚禮像街,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己镰绎,他們只是感情好脓斩,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,585評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著畴栖,像睡著了一般随静。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上吗讶,一...
    開(kāi)封第一講書(shū)人閱讀 51,462評(píng)論 1 302
  • 那天燎猛,我揣著相機(jī)與錄音,去河邊找鬼照皆。 笑死重绷,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的膜毁。 我是一名探鬼主播昭卓,決...
    沈念sama閱讀 40,262評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼瘟滨!你這毒婦竟也來(lái)了候醒?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,153評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤室奏,失蹤者是張志新(化名)和其女友劉穎火焰,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體胧沫,經(jīng)...
    沈念sama閱讀 45,587評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡昌简,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,792評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了绒怨。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片纯赎。...
    茶點(diǎn)故事閱讀 39,919評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖南蹂,靈堂內(nèi)的尸體忽然破棺而出犬金,到底是詐尸還是另有隱情,我是刑警寧澤六剥,帶...
    沈念sama閱讀 35,635評(píng)論 5 345
  • 正文 年R本政府宣布晚顷,位于F島的核電站,受9級(jí)特大地震影響疗疟,放射性物質(zhì)發(fā)生泄漏该默。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,237評(píng)論 3 329
  • 文/蒙蒙 一策彤、第九天 我趴在偏房一處隱蔽的房頂上張望栓袖。 院中可真熱鬧匣摘,春花似錦、人聲如沸裹刮。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,855評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)捧弃。三九已至赠叼,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間违霞,已是汗流浹背梅割。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,983評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留葛家,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,048評(píng)論 3 370
  • 正文 我出身青樓泌类,卻偏偏與公主長(zhǎng)得像癞谒,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子刃榨,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,864評(píng)論 2 354