Pandas包是我使用最頻繁的幾個python包之一, 功能強大, 雖然由于項目的原因, 可能會使用R里面的tidyverse來實現(xiàn)同樣的功能, 但pandas包也不能忽略.
同學習numpy一樣, 學習pandas包的幾個技巧無非也就是, 如何創(chuàng)建, 如何索引, 如何切片, 如何針對行和列進行操作, 當然由于Dataframe這個格式的存在, 數(shù)據(jù)的聚合, 新增列, 刪除列, 刪除重復等等操作也不可忽略. 并且當Python包和其它可視化包聯(lián)用的時候, 功能也會變得無比強大, 也就是我們常說的一行代碼出圖.
太簡單的使用方法也就不說了, 下面筆記中涉及到的一些函數(shù), 要么真的真的用的很頻繁, 要么用的不多,但是比較有用.
import pandas as pd
#Series部分
pd.Series.value_count()
pd.Series.describe()
pd.Series.mean()
pd.Series.sort_values(ascending=False)
pd.Series.map()
#DataFrame部分
df.groupby("val")
df.get_group("group_val")
未完待續(xù)...