Dataframe某行含有純空格數(shù)據(jù)解決辦法

Pandas數(shù)據(jù)處理

這兩天在進行數(shù)據(jù)預處理時姑廉,發(fā)現(xiàn)在進行預料喂入時缺亮,總會出現(xiàn)錯誤:ValueError: not enough values to unpack (expected 2, got 1),但是在文本清洗時沒有顯示含有NaN的數(shù)據(jù)行,查看數(shù)據(jù)后發(fā)現(xiàn)有數(shù)據(jù)行為純空格桥言,但不會被df.isnull().any()查看到瞬内,記錄下解決辦法迷雪。

問題示例

data = {'id':[1,2,3],
     'text':['The title is fine as it is.','Explanation\nWhy the edits made under my usern',' ']}
df = pd.DataFrame(data)
df

    id                             text
0    1                     The title is fine as it is.
1    2    Explanation\nWhy the edits made under my usern
2    3             

df.isnull().any()
-------------------
id      False
text    False
dtype: bool

這顯然沒有達到我的預期需求,因為切分數(shù)據(jù)時虫蝶,空格數(shù)據(jù)在過濾后為NaN值導致切分數(shù)據(jù)時出錯

解決方法

直接使用Series的.apply方法來修改變量text中的每個值章咧。如果發(fā)現(xiàn)是空格,就返回NaN能真,否則就返回原值赁严。

df["text"]=df["text"].apply(lambda x: np.NaN if str(x).isspace() else x)
df

df.isnull().any()
-------------------
id      False
text    True
dtype: bool

df[df.isnull().values==True]
-----------------------------
   id text
2   3  NaN

另一種情況

        text
0   <review id="5000">\n
1   \n
2   看過此人在百家講壇的演講\n
3   \n
4   </review>\n

使用df[text_field] = df[text_field].str.replace(r"[\n]", "")方法去除了\n后,不清楚原因是什么粉铐,使用上面的方法沒有效果疼约,但用data.to_csv()方法寫出到文件后,再從新讀取就可以了

      comment_text
0   <review id="5000">
1   NaN
2   看過此人在百家講壇的演講蝙泼。
3   NaN
4   </review>
使用data.dropna()去除空值的數(shù)據(jù)行
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末程剥,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子汤踏,更是在濱河造成了極大的恐慌织鲸,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,590評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件溪胶,死亡現(xiàn)場離奇詭異搂擦,居然都是意外死亡,警方通過查閱死者的電腦和手機哗脖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,157評論 3 399
  • 文/潘曉璐 我一進店門瀑踢,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人才避,你說我怎么就攤上這事橱夭。” “怎么了桑逝?”我有些...
    開封第一講書人閱讀 169,301評論 0 362
  • 文/不壞的土叔 我叫張陵徘钥,是天一觀的道長。 經(jīng)常有香客問我肢娘,道長呈础,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,078評論 1 300
  • 正文 為了忘掉前任橱健,我火速辦了婚禮而钞,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘拘荡。我一直安慰自己臼节,他們只是感情好,可當我...
    茶點故事閱讀 69,082評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著网缝,像睡著了一般巨税。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上粉臊,一...
    開封第一講書人閱讀 52,682評論 1 312
  • 那天草添,我揣著相機與錄音,去河邊找鬼扼仲。 笑死远寸,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的屠凶。 我是一名探鬼主播驰后,決...
    沈念sama閱讀 41,155評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼矗愧!你這毒婦竟也來了灶芝?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 40,098評論 0 277
  • 序言:老撾萬榮一對情侶失蹤唉韭,失蹤者是張志新(化名)和其女友劉穎夜涕,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體纽哥,經(jīng)...
    沈念sama閱讀 46,638評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡钠乏,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,701評論 3 342
  • 正文 我和宋清朗相戀三年栖秕,在試婚紗的時候發(fā)現(xiàn)自己被綠了春塌。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,852評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡簇捍,死狀恐怖只壳,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情暑塑,我是刑警寧澤吼句,帶...
    沈念sama閱讀 36,520評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站事格,受9級特大地震影響惕艳,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜驹愚,卻給世界環(huán)境...
    茶點故事閱讀 42,181評論 3 335
  • 文/蒙蒙 一远搪、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧逢捺,春花似錦谁鳍、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,674評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽绷柒。三九已至,卻和暖如春涮因,著一層夾襖步出監(jiān)牢的瞬間废睦,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,788評論 1 274
  • 我被黑心中介騙來泰國打工蕊退, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留郊楣,地道東北人。 一個月前我還...
    沈念sama閱讀 49,279評論 3 379
  • 正文 我出身青樓瓤荔,卻偏偏與公主長得像净蚤,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子输硝,可洞房花燭夜當晚...
    茶點故事閱讀 45,851評論 2 361

推薦閱讀更多精彩內(nèi)容