前途未定凌净,憂之。幾日看某牛牛好友在玩簡書屋讶,遂亦有心投入泻蚊。
? ? ? ?這幾天再看利用python進行數(shù)據(jù)分析。雖然python我也才學習了一個月丑婿,但是一直苦于沒有一個實戰(zhàn)去做一個項目⌒孕郏現(xiàn)在有了這個機會,肯定好好把握下羹奉。
? ? ? ?下面應該貼比較多大神的筆記秒旋,以記錄自己的學習過程,給自己鼓舞诀拭,同時迁筛,也供其他學習的同學一起學習。
使用pandas進行數(shù)據(jù)清洗
目錄:
duplicated() :找出重復數(shù)據(jù)
drop_duplicated():刪除重復數(shù)據(jù)
isnull()耕挨、notnull() :都為找到空值细卧,前一個有就是True,后一個沒有為True
dropna() ? ? :將每列中的空格直接除去
fillna() ? ? ? ? :將指定列的空格補上你想要的數(shù)
查看數(shù)據(jù)中的空格:value_counts()
去除數(shù)據(jù)中的空格:map(str.strip)
大小寫轉(zhuǎn)換:map(str.upper):轉(zhuǎn)成大寫
? ? ? ? ? ? ? ? ? ?map(str.lower):轉(zhuǎn)成小寫
? ? ? ? ? ? ? ? ? ?map(str.title):首字母大寫
replace():異常值替換
astype():更改數(shù)據(jù)格式
to_datetime():日期格式的數(shù)據(jù)更改
cut():對數(shù)據(jù)進行分組并將分組后的名稱添加到數(shù)據(jù)表
split()數(shù)據(jù)分列操作
數(shù)據(jù)為何要清洗:因為得到的數(shù)據(jù)大都有重復筒占,缺損等狀況贪庙,所以我們想從這堆數(shù)據(jù)里面找到有用信息就必須要對數(shù)據(jù)進行相關處理,這就是清洗翰苫。