Pandas入門
大家好哑梳,我是Peter~
最近小編將自己寫作的Pandas系列的入門文章濃縮成了一份簡單的PPT逃呼。PPT的內(nèi)容主要是介紹了Pandas的常見數(shù)據(jù)結(jié)構(gòu)拄养,以及高頻的函數(shù):
- Pandas的兩種數(shù)據(jù)結(jié)構(gòu)
- 11種方式創(chuàng)建DataFrame
- DataFrame取數(shù)技巧
- 數(shù)據(jù)處理基石:Pandas數(shù)據(jù)探索
- Pandas數(shù)據(jù)類型
- Pandas重點機制:groupby、rank腮鞍、sort_values
- Pandas缺失值弛房、重復(fù)值處理
- Pandas數(shù)據(jù)合并:merge道盏、concat
- 軸旋轉(zhuǎn)操作:unstack和stack
- Pandas透視表
一份簡單的PPT,希望對學(xué)習(xí)Pandas的朋友有所幫助文捶。文末有PPT的具體獲取方式
PPT內(nèi)容
兩大數(shù)據(jù)結(jié)構(gòu)
Pandas中主要是有兩大數(shù)據(jù)結(jié)構(gòu):Series和DataFrame荷逞。
- Series數(shù)據(jù):由name、index拄轻、values組成
- DataFrame數(shù)據(jù):可以看成是多個Series數(shù)據(jù)組成
Pandas的數(shù)據(jù)處理更多情況下是和DataFrame打交道颅围。在下面的導(dǎo)圖中,重點介紹了如何通過11種不同的方式來生成DataFrame類型的數(shù)據(jù)恨搓。
在我們拿到了一份數(shù)據(jù)之后院促,讀取成為DataFrame后,需要找到我們需要的數(shù)據(jù)斧抱。如何查看或者找到我們想要的數(shù)據(jù)呢常拓?下面是介紹了各種方法來取數(shù),大致可以分為:
- 表達(dá)式取數(shù)
- 索引/屬性取數(shù)
- 切片取數(shù)
- 使用函數(shù)取數(shù)等
有了一份數(shù)據(jù)辉浦,在處理之前我們必須查看這個數(shù)據(jù)一些基本信息:數(shù)據(jù)的大小弄抬、維度、字段類型宪郊、缺失值情況等掂恕,我們把這項工作稱之為:數(shù)據(jù)探索
在下面的內(nèi)容中將pandas拖陆、python原生、numpy的3種不同數(shù)據(jù)類型進行了比較:
在下面的幾頁PPT中懊亡,介紹了Pandas高頻使用的函數(shù):groupby依啰、rank、sort_values店枣、drop_duplicated速警、merge、concat等鸯两。它們主要是應(yīng)用在數(shù)據(jù)的預(yù)處理闷旧、數(shù)據(jù)合并、數(shù)據(jù)去重钧唐、透視表的制作等方面
獲取方式
關(guān)注【尤而小屋】忙灼,回復(fù):熊貓即可