Python pandas 里面的數(shù)據(jù)類型坑本今,astype要慎用

背景

最近在項(xiàng)目處理數(shù)據(jù)時(shí)拆座,對pandas里面的數(shù)據(jù)類型進(jìn)行轉(zhuǎn)換時(shí)(astype),產(chǎn)生了一些意外的情況冠息,經(jīng)過研究挪凑,對數(shù)據(jù)框里面的數(shù)據(jù)類型,又有了新的認(rèn)識逛艰,分享出來供大家參考學(xué)習(xí)躏碳。

創(chuàng)建模擬數(shù)據(jù)

模擬數(shù)據(jù)
  • 假如模擬的數(shù)據(jù)如上圖所示,里面有一些空單元格散怖,下面讀取模擬數(shù)據(jù)
import pandas as pd
import numpy as np

data=pd.read_excel('111.xlsx',sheet_name='astype')

data
讀取模擬數(shù)據(jù)
  • 查看整體數(shù)據(jù)類型菇绵,可以看出所有的數(shù)據(jù)類型均為object肄渗,這里的object對應(yīng)的是python里面的str字符類型
data.dtypes
數(shù)據(jù)類型
數(shù)據(jù)類型對應(yīng)
  • 查看字段4每一個(gè)數(shù)據(jù)是什么類型
for i in data['字段4']:
    print(i,'\t',type(i))
每個(gè)數(shù)據(jù)類型

可以看出字段4這一列里面,有str脸甘、float恳啥、int三種數(shù)據(jù)類型,這里就可以看出一列里面數(shù)據(jù)類型可以不同丹诀,類似Excel一列钝的,每個(gè)單元格可以存放不同類型的數(shù)據(jù),和數(shù)據(jù)庫里面一列完全不一樣铆遭,數(shù)據(jù)庫里面一列數(shù)據(jù)類型在建表時(shí)硝桩,已聲明類型,只存放一種類型枚荣。但是上面在獲取整列數(shù)據(jù)類型時(shí)返回的是object碗脊,用的是最大的數(shù)據(jù)類型,能囊括整列的數(shù)據(jù)類型

如果astype類型強(qiáng)制轉(zhuǎn)換

data['字段4_astype']=data['字段4'].astype('str')

data

for i in data['字段4_astype']:
    print(i,'\t',type(i))
類型強(qiáng)制轉(zhuǎn)換

可以看出這里全部轉(zhuǎn)換為str橄妆,NaN也會強(qiáng)制轉(zhuǎn)換為字符型nan衙伶,不再是np.nan

nan

這樣的話就出現(xiàn)一個(gè)問題,astype是強(qiáng)制把所有的類型都轉(zhuǎn)換為str害碾,而不忽略NaN矢劲,要對非NAN進(jìn)行轉(zhuǎn)換,就需要自定義函數(shù)來實(shí)現(xiàn)

自定義函數(shù)實(shí)現(xiàn)非NAN轉(zhuǎn)換類型

def astype_str_notna(df):
    '''
    傳入?yún)?shù):數(shù)據(jù)框里面一列  Series
    
    return:轉(zhuǎn)換后的一列  Series
    '''
    t=[]
    for i in df:
        if type(i)== float:
            if not np.isnan(i):
                i=str(int(i))
        if type(i)== int:
            i=str(i)
            
        t.append(i)
     
    
    return pd.Series(t)

data['字段4_def']=astype_str_notna(data['字段4'])

data

data['字段4'].isna()
自定義函數(shù)

通過自定義函數(shù)慌随,可以實(shí)現(xiàn)數(shù)據(jù)類型轉(zhuǎn)換芬沉,而忽略NAN,從而達(dá)到在數(shù)據(jù)統(tǒng)計(jì)時(shí)阁猜,不會計(jì)算NAN

數(shù)據(jù)統(tǒng)計(jì)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末丸逸,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子剃袍,更是在濱河造成了極大的恐慌黄刚,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,214評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件民效,死亡現(xiàn)場離奇詭異隘击,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)研铆,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來州叠,“玉大人棵红,你說我怎么就攤上這事∵掷酰” “怎么了逆甜?”我有些...
    開封第一講書人閱讀 152,543評論 0 341
  • 文/不壞的土叔 我叫張陵虱肄,是天一觀的道長。 經(jīng)常有香客問我交煞,道長咏窿,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,221評論 1 279
  • 正文 為了忘掉前任素征,我火速辦了婚禮集嵌,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘御毅。我一直安慰自己根欧,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,224評論 5 371
  • 文/花漫 我一把揭開白布端蛆。 她就那樣靜靜地躺著凤粗,像睡著了一般。 火紅的嫁衣襯著肌膚如雪今豆。 梳的紋絲不亂的頭發(fā)上嫌拣,一...
    開封第一講書人閱讀 49,007評論 1 284
  • 那天,我揣著相機(jī)與錄音呆躲,去河邊找鬼异逐。 笑死,一個(gè)胖子當(dāng)著我的面吹牛歼秽,可吹牛的內(nèi)容都是我干的应役。 我是一名探鬼主播,決...
    沈念sama閱讀 38,313評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼燥筷,長吁一口氣:“原來是場噩夢啊……” “哼箩祥!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起肆氓,我...
    開封第一講書人閱讀 36,956評論 0 259
  • 序言:老撾萬榮一對情侶失蹤袍祖,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后谢揪,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蕉陋,經(jīng)...
    沈念sama閱讀 43,441評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,925評論 2 323
  • 正文 我和宋清朗相戀三年拨扶,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了凳鬓。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,018評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡患民,死狀恐怖缩举,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤仅孩,帶...
    沈念sama閱讀 33,685評論 4 322
  • 正文 年R本政府宣布托猩,位于F島的核電站,受9級特大地震影響辽慕,放射性物質(zhì)發(fā)生泄漏京腥。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,234評論 3 307
  • 文/蒙蒙 一溅蛉、第九天 我趴在偏房一處隱蔽的房頂上張望公浪。 院中可真熱鬧,春花似錦温艇、人聲如沸因悲。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽晃琳。三九已至,卻和暖如春琐鲁,著一層夾襖步出監(jiān)牢的瞬間卫旱,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評論 1 261
  • 我被黑心中介騙來泰國打工围段, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留顾翼,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,467評論 2 352
  • 正文 我出身青樓奈泪,卻偏偏與公主長得像适贸,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子涝桅,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,762評論 2 345