Python學習筆記-3群18組-杜杜狼-2017.7.18

Lesson 11. 重復值處理 pandas

行相同的數(shù)據(jù)只保留一行

//找出重復行的位置
dIndex = df.duplicated()
//根據(jù)某些列练湿,找出重復的位置
dIndex = df.duplicated('column_name')
dIndex = df.duplicated(['column_1', 'column_2'])
//根據(jù)返回值元践,把重復數(shù)據(jù)提取出來
df[dIndex]
//刪除重復值(默認按照所有列進行比較)
newDF = df.drop_duplicates()
//根據(jù)指定列刪除
newDF = df.drop_duplicates('column_name')

Lesson 12. 缺失值處理 pandas

產(chǎn)生原因:1. 信息暫時無法獲取 2. 信息被遺漏或錯誤處理
處理方法:1. 數(shù)據(jù)補齊(平均值填充) 2. 刪除對應缺失行(數(shù)據(jù)量過少不適用) 3. 不處理

Attention: pandas DataFrame 用NaN標注缺失值

from pandas import read_csv
df = read_csv('/Users/DuDuLang/Downloads/sample.csv',sep=',', engine='python')
#找出空值的位置,返回一張boolean table
isNA = df.isnull()
#獲取空值所在行
df[isNA.any(axis=1)]
df[isNA[['sallary']].any(axis=1)]
df[isNA[['sallary', 'total']].any(axis=1)]
#補全空值
df.fillna('n/a')

Lesson 13. 空格值處理
strip:清除字符型數(shù)據(jù)左右的空格 = trim

#清除字符串左側空格 **注意提取的值是str類型**
df['address'] = df['address'].str.lstrip()
#清除字符串右側空格
df['address'] = df['address'].str.rstrip()
#清除字符串兩側空格
df['address'] = df['address'].str.strip()

Lesson 14. 字段抽取
根據(jù)已知列數(shù)據(jù)的開始和結束位置被辑,抽取出新的列
slice(start, stop) 前閉后開區(qū)間

Lesson 15. 字段拆分
按照固定的字符挽封,拆分已有字符串
split(sep, n, expand=False)
sep: 用于分割的字符串
n: 分割為多少列已球,從0開始:如果為0,表示不拆分
expand: 是否展開為DataFrame, default: False -> Series, True -> DataFrame

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末辅愿,一起剝皮案震驚了整個濱河市智亮,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌点待,老刑警劉巖阔蛉,帶你破解...
    沈念sama閱讀 211,948評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異癞埠,居然都是意外死亡馍忽,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,371評論 3 385
  • 文/潘曉璐 我一進店門燕差,熙熙樓的掌柜王于貴愁眉苦臉地迎上來遭笋,“玉大人,你說我怎么就攤上這事徒探⊥吆簦” “怎么了?”我有些...
    開封第一講書人閱讀 157,490評論 0 348
  • 文/不壞的土叔 我叫張陵测暗,是天一觀的道長央串。 經(jīng)常有香客問我,道長碗啄,這世上最難降的妖魔是什么质和? 我笑而不...
    開封第一講書人閱讀 56,521評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮稚字,結果婚禮上饲宿,老公的妹妹穿的比我還像新娘厦酬。我一直安慰自己,他們只是感情好瘫想,可當我...
    茶點故事閱讀 65,627評論 6 386
  • 文/花漫 我一把揭開白布仗阅。 她就那樣靜靜地躺著,像睡著了一般国夜。 火紅的嫁衣襯著肌膚如雪减噪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,842評論 1 290
  • 那天车吹,我揣著相機與錄音筹裕,去河邊找鬼。 笑死窄驹,一個胖子當著我的面吹牛朝卒,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播馒吴,決...
    沈念sama閱讀 38,997評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼瑟曲!你這毒婦竟也來了饮戳?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,741評論 0 268
  • 序言:老撾萬榮一對情侶失蹤洞拨,失蹤者是張志新(化名)和其女友劉穎扯罐,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體烦衣,經(jīng)...
    沈念sama閱讀 44,203評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡歹河,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,534評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了花吟。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片秸歧。...
    茶點故事閱讀 38,673評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖衅澈,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情今布,我是刑警寧澤经备,帶...
    沈念sama閱讀 34,339評論 4 330
  • 正文 年R本政府宣布部默,位于F島的核電站,受9級特大地震影響傅蹂,放射性物質發(fā)生泄漏纷闺。R本人自食惡果不足惜算凿,卻給世界環(huán)境...
    茶點故事閱讀 39,955評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望急但。 院中可真熱鬧,春花似錦波桩、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,770評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至萤皂,卻和暖如春撒穷,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背裆熙。 一陣腳步聲響...
    開封第一講書人閱讀 32,000評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留蛤奥,地道東北人。 一個月前我還...
    沈念sama閱讀 46,394評論 2 360
  • 正文 我出身青樓凡桥,卻偏偏與公主長得像,于是被迫代替她去往敵國和親缅刽。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,562評論 2 349

推薦閱讀更多精彩內(nèi)容