pivot_table
基本語法:pandas.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All', observed=False, sort=True)
new=pd.pivot_table(
df, #表名
index=[column], #索引,行分類,必須值,可以放多個(gè)值
columns=[column],#列他挎,列分類拍屑,可選值墅茉,可以多個(gè)值
values=[column], #計(jì)算值的列昧甘,可以放多個(gè)值
aggfunc=lambda x: x.value_counts().count() #方式1良拼,單個(gè)值
aggfunc=[np.sum,np.mean] #方式2,多個(gè)值
aggfunc={column1:[np.sum,np.mean],column2:np.sum} #方式3充边,多個(gè)值
,fill_value=0 #空值填充
,dropna=False #True時(shí)如果列的所有值都是NaN庸推,將被刪除,默認(rèn)為False
,margins=True # 會(huì)添加行/列的總計(jì) 默認(rèn)為False
,margins_name=str #為總計(jì)設(shè)置名稱
)
aggfunc
對(duì)values值計(jì)算方式浇冰,常用方法有
lambda x: len(x.value_counts()) 去重計(jì)數(shù)
np.min
np.max
np.mean
np.median
aggfunc可以使用dict類型