小結(jié)-數(shù)據(jù)挖掘-Pandas的常見用法

Pandas用途

高效處理結(jié)構(gòu)化數(shù)據(jù)太示,方便于數(shù)據(jù)導(dǎo)入、清理香浩、建模类缤、可視化。

  • 缺失數(shù)據(jù)的處理
  • 數(shù)據(jù)的插入刪除
  • 分組聚合查詢
  • 切片邻吭、索引呀非、截取
  • 合并、連接數(shù)據(jù)
  • ...

Pandas常見用法

導(dǎo)入镜盯、導(dǎo)出數(shù)據(jù)

參考

pd.readcsv()

pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, prefix=None, encoding=None)

delimiter: 定界符岸裙,備選分隔符(如果指定該參數(shù),則sep參數(shù)失效)

header: 默認(rèn)設(shè)置為0(即第一行作為表頭)速缆,如果沒有表頭的話降允,要修改參數(shù),設(shè)置header=None

names:一般我們沒有表頭艺糜,即header=None時剧董,這個用來添加列名

prefix:給列名添加前綴

pd.tocsv()

pd.tocsv(filepath_or_buffer, sep=',', na_rep=None, columns=None,
header=0, index=True)

na_rep: 字符串,將NaN轉(zhuǎn)換為特定值

columns: 列表破停,指定哪些列寫進(jìn)去

index: 關(guān)于索引的翅楼,默認(rèn)True,寫入索引

查看數(shù)據(jù)

# 頂部
df.head()
# 概覽,默認(rèn)只describe數(shù)值型列;
df.describe(include='all')
# 按軸排序
df.sort_index(axis=0, ascending=False)
# 按值排序
df.sort_value(by='column3')

選擇數(shù)據(jù)(過濾數(shù)據(jù)實用真慢!)

# df.column3
df['column3']
# 切片, 行列切片
df[0:3,5:10]
# 按標(biāo)簽選擇
df.loc[;,['A', 'B']]
# 按位置選擇,按照隱藏索引選擇
df.iloc[0:5, 0:2]
# 過濾數(shù)據(jù)毅臊, 類似于sql的條件查詢
df[df['columnA'] > 0]
# isin方法過濾
df[df['columnA'].isin(['1', '2', '10'])]

缺失值處理

# 只要行列出現(xiàn)空缺值,就刪除黑界;
df.dropna(how='any')
# 當(dāng)整個行或列出現(xiàn)NaN就刪除管嬉;
df.dropna(how='all')
# 填充缺失值
df.fillna(value='missing')

數(shù)據(jù)操作

# apply應(yīng)用, 需要傳遞一個func
df.apply(lambda x: x.max() - x.min())
# 針對當(dāng)前列的值進(jìn)行統(tǒng)計計數(shù)
df['columnA'].value_counts()

合并數(shù)據(jù)

# 左連接,合并兩個相同id的df表格,以左邊的為基準(zhǔn)朗鸠;(類似于sql的左連接)
pd.merge(left_df, right_df, on='_id', how='left')

分組

# 分組求和蚯撩,常用級別
df.groupby('columnA').sum()

繪圖

df.plot.bar(df['columnA'])
plt.figure()
plt.legend()

更多參考:中文官網(wǎng)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市烛占,隨后出現(xiàn)的幾起案子胎挎,更是在濱河造成了極大的恐慌,老刑警劉巖忆家,帶你破解...
    沈念sama閱讀 219,110評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件犹菇,死亡現(xiàn)場離奇詭異,居然都是意外死亡弦赖,警方通過查閱死者的電腦和手機(jī)项栏,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,443評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蹬竖,“玉大人沼沈,你說我怎么就攤上這事流酬。” “怎么了列另?”我有些...
    開封第一講書人閱讀 165,474評論 0 356
  • 文/不壞的土叔 我叫張陵芽腾,是天一觀的道長。 經(jīng)常有香客問我页衙,道長摊滔,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,881評論 1 295
  • 正文 為了忘掉前任店乐,我火速辦了婚禮艰躺,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘眨八。我一直安慰自己腺兴,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,902評論 6 392
  • 文/花漫 我一把揭開白布廉侧。 她就那樣靜靜地躺著页响,像睡著了一般。 火紅的嫁衣襯著肌膚如雪段誊。 梳的紋絲不亂的頭發(fā)上闰蚕,一...
    開封第一講書人閱讀 51,698評論 1 305
  • 那天,我揣著相機(jī)與錄音连舍,去河邊找鬼没陡。 笑死,一個胖子當(dāng)著我的面吹牛烟瞧,可吹牛的內(nèi)容都是我干的诗鸭。 我是一名探鬼主播染簇,決...
    沈念sama閱讀 40,418評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼参滴,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了锻弓?” 一聲冷哼從身側(cè)響起砾赔,我...
    開封第一講書人閱讀 39,332評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎青灼,沒想到半個月后暴心,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,796評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡杂拨,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,968評論 3 337
  • 正文 我和宋清朗相戀三年专普,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片弹沽。...
    茶點故事閱讀 40,110評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡檀夹,死狀恐怖筋粗,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情炸渡,我是刑警寧澤娜亿,帶...
    沈念sama閱讀 35,792評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站蚌堵,受9級特大地震影響买决,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜吼畏,卻給世界環(huán)境...
    茶點故事閱讀 41,455評論 3 331
  • 文/蒙蒙 一督赤、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧泻蚊,春花似錦够挂、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,003評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至毅贮,卻和暖如春办悟,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背滩褥。 一陣腳步聲響...
    開封第一講書人閱讀 33,130評論 1 272
  • 我被黑心中介騙來泰國打工病蛉, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人瑰煎。 一個月前我還...
    沈念sama閱讀 48,348評論 3 373
  • 正文 我出身青樓铺然,卻偏偏與公主長得像,于是被迫代替她去往敵國和親酒甸。 傳聞我的和親對象是個殘疾皇子魄健,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,047評論 2 355

推薦閱讀更多精彩內(nèi)容