1福澡、主要作用
這個和excel中分類匯總或者透視表實現(xiàn)的功能是一樣的,比如有一組關(guān)于客戶的數(shù)據(jù)流妻,里面有客戶的性別牲蜀、年齡段等數(shù)據(jù),現(xiàn)在想要知道每個年齡段每個性別有多少人绅这。
2涣达、常見應(yīng)用1:單類分組
單類分組是指只有一個統(tǒng)計變量,如下面的統(tǒng)計字段['shot_zone_basic'] (數(shù)據(jù)是來自kaggle比賽數(shù)據(jù))
創(chuàng)建groupby對象
以上的操作只能創(chuàng)建一個groupby對象,一般在應(yīng)用中會加上要統(tǒng)計的方式度苔,如下客戶直接展示數(shù)據(jù)的多種統(tǒng)計指標(biāo)匆篓,當(dāng)然如果只需要統(tǒng)計一種統(tǒng)計指標(biāo)可以直接將descrbe()替換成mean()、count()等寇窑。
按組統(tǒng)計相關(guān)統(tǒng)計指標(biāo)
很多時候統(tǒng)計的指標(biāo)和數(shù)據(jù)變量較多時鸦概,數(shù)據(jù)使用橫排展示在視覺上很難看清,這時可以使用unstack()函數(shù)優(yōu)化展示甩骏。
unstack()可以理解為將原來橫排變成豎排數(shù)據(jù)展示更好
3窗市、常見應(yīng)用2:多類分組
多類統(tǒng)計是統(tǒng)計時有一個以上的變量,在實際工作中應(yīng)用就是多個變量多個統(tǒng)計指標(biāo)的統(tǒng)計方式饮笛,如下:
多類統(tǒng)計
多類多方式統(tǒng)計
4咨察、groupby中匿名函數(shù)的應(yīng)用
這種應(yīng)用場景主要是針對在統(tǒng)計數(shù)據(jù)中某個字段時,僅統(tǒng)計字段中某一部分的內(nèi)容福青,這個時候需要對字段進(jìn)行自定義處理摄狱,如下:
groupby中使用匿名函數(shù)整理統(tǒng)計數(shù)據(jù)