Pandas詳解十之Dropna濾除缺失數(shù)據(jù)

約定

import pandas as pd
import numpy as np
from numpy import nan as NaN

濾除缺失數(shù)據(jù)

pandas的設(shè)計(jì)目標(biāo)之一就是使得處理缺失數(shù)據(jù)的任務(wù)更加輕松些妙色。pandas使用NaN作為缺失數(shù)據(jù)的標(biāo)記。

使用dropna使得濾除缺失數(shù)據(jù)更加得心應(yīng)手奔浅。

一、處理Series對象

  • 通過dropna()濾除缺失數(shù)據(jù):
se1=pd.Series([4,NaN,8,NaN,5])
print(se1)
se1.dropna()

代碼結(jié)果:

0    4.0
1    NaN
2    8.0
3    NaN
4    5.0
dtype: float64

0    4.0
2    8.0
4    5.0
dtype: float64
  • 通過布爾序列也能濾除:
se1[se1.notnull()]

代碼結(jié)果:

0    4.0
2    8.0
4    5.0
dtype: float64

二、處理DataFrame對象

處理DataFrame對象比較復(fù)雜消请,因?yàn)槟憧赡苄枰獊G棄所有的NaN或部分NaN。

df1=pd.DataFrame([[1,2,3],[NaN,NaN,2],[NaN,NaN,NaN],[8,8,NaN]])
df1

代碼結(jié)果:

0 1 2
0 1.0 2.0 3.0
1 NaN NaN 2.0
2 NaN NaN NaN
3 8.0 8.0 NaN
  • 默認(rèn)濾除所有包含NaN:
df1.dropna()

代碼結(jié)果:

0 1 2
0 1.0 2.0 3.0
  • 傳入**how='all' **濾除全為NaN的行:
df1.dropna(how='all')

代碼結(jié)果:

0 1 2
0 1.0 2.0 3.0
1 NaN NaN 2.0
3 8.0 8.0 NaN
  • 傳入axis=1濾除列:
df1[3]=NaN
df1

代碼結(jié)果:

0 1 2 3
0 1.0 2.0 3.0 NaN
1 NaN NaN 2.0 NaN
2 NaN NaN NaN NaN
3 8.0 8.0 NaN NaN
df1.dropna(axis=1,how="all")

代碼結(jié)果:

0 1 2
0 1.0 2.0 3.0
1 NaN NaN 2.0
2 NaN NaN NaN
3 8.0 8.0 NaN
  • 傳入thresh=n保留至少有n個(gè)非NaN數(shù)據(jù)的行:
df1.dropna(thresh=1)

代碼結(jié)果:

0 1 2 3
0 1.0 2.0 3.0 NaN
1 NaN NaN 2.0 NaN
3 8.0 8.0 NaN NaN
df1.dropna(thresh=3)

代碼結(jié)果:

0 1 2 3
0 1.0 2.0 3.0 NaN
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末瘤旨,一起剝皮案震驚了整個(gè)濱河市梯啤,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌存哲,老刑警劉巖因宇,帶你破解...
    沈念sama閱讀 218,036評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件七婴,死亡現(xiàn)場離奇詭異,居然都是意外死亡察滑,警方通過查閱死者的電腦和手機(jī)打厘,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,046評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來贺辰,“玉大人户盯,你說我怎么就攤上這事∷腔” “怎么了莽鸭?”我有些...
    開封第一講書人閱讀 164,411評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長吃靠。 經(jīng)常有香客問我硫眨,道長,這世上最難降的妖魔是什么巢块? 我笑而不...
    開封第一講書人閱讀 58,622評論 1 293
  • 正文 為了忘掉前任礁阁,我火速辦了婚禮,結(jié)果婚禮上族奢,老公的妹妹穿的比我還像新娘姥闭。我一直安慰自己,他們只是感情好越走,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,661評論 6 392
  • 文/花漫 我一把揭開白布棚品。 她就那樣靜靜地躺著,像睡著了一般弥姻。 火紅的嫁衣襯著肌膚如雪南片。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,521評論 1 304
  • 那天庭敦,我揣著相機(jī)與錄音疼进,去河邊找鬼。 笑死秧廉,一個(gè)胖子當(dāng)著我的面吹牛伞广,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播疼电,決...
    沈念sama閱讀 40,288評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼嚼锄,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蔽豺?” 一聲冷哼從身側(cè)響起区丑,我...
    開封第一講書人閱讀 39,200評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后沧侥,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體可霎,經(jīng)...
    沈念sama閱讀 45,644評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,837評論 3 336
  • 正文 我和宋清朗相戀三年宴杀,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了癣朗。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,953評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡旺罢,死狀恐怖旷余,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情扁达,我是刑警寧澤正卧,帶...
    沈念sama閱讀 35,673評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站跪解,受9級特大地震影響穗酥,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜惠遏,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,281評論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望骏啰。 院中可真熱鬧节吮,春花似錦、人聲如沸判耕。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,889評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽壁熄。三九已至帚豪,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間草丧,已是汗流浹背狸臣。 一陣腳步聲響...
    開封第一講書人閱讀 33,011評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留昌执,地道東北人烛亦。 一個(gè)月前我還...
    沈念sama閱讀 48,119評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像懂拾,于是被迫代替她去往敵國和親煤禽。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,901評論 2 355