本篇筆記為原書第九章節(jié)的內(nèi)容雅宾。
- The GroupBy object
DataFrame數(shù)據(jù)進(jìn)行分組操作
- df.groupby('col-name')
- groups_object.get_group('group-name')
-
groups_object.mean() # 一些統(tǒng)計(jì)操作子
對(duì)數(shù)據(jù)集進(jìn)行分組操作
查看分組后數(shù)據(jù)情況:
-
len(groups) # 共分成多少個(gè)組別
-
groups.size() # 查看各組別數(shù)據(jù)量大小
組別對(duì)象數(shù)據(jù)結(jié)構(gòu)的屬性和方法
- groups # 返回各組別數(shù)據(jù)的索引值
- first() # 返回各組別里的第一條數(shù)據(jù)形成新數(shù)據(jù)
- last() # 返回各組別里最后一條數(shù)據(jù)形成新數(shù)據(jù)
- nth(n) # 返回各組別里第n-1條數(shù)據(jù)形成新數(shù)據(jù)
- head(n) # 返回各組數(shù)據(jù)的前n條數(shù)據(jù)
- tail(n)
-
get_group('group-name') # 取得某一組別數(shù)據(jù)
聚合操作
- sum()
- mean()
- get_group().loc[] # 取得某組里的某索引值下的數(shù)據(jù)
- max()
- min()
-
agg() # 對(duì)各列進(jìn)行各種方式統(tǒng)計(jì)計(jì)算
自定義操作
多組別操作
多列進(jìn)行聯(lián)合分組取值操作蔓榄,多列值組成的tuple
同樣多組別也跟之前的數(shù)據(jù)一樣有各種屬性和操作方法,具體使用可百度或查閱手冊(cè)。