一:介紹:
aggregate函數(shù)是數(shù)據(jù)處理中常用到的函數(shù),具有強(qiáng)大的功能∽镎耄可以按照要求把數(shù)據(jù)打組聚合,然后對(duì)聚合以后的數(shù)據(jù)進(jìn)行加和黄伊、求平均等各種操作泪酱。具體說明可使用命令:help("aggregate")獲取官方文檔。
aggregate(x, by, FUN, ..., simplify = TRUE, drop = TRUE)
x:an R object.
一個(gè)R對(duì)象还最。
by:a list of grouping elements, each as long as the variables in the data frame x. The elements are coerced to factors before use.
一列分組元素墓阀,每個(gè)與數(shù)據(jù)框x中的變量等長(zhǎng)。元素在使用之前被強(qiáng)制為因子拓轻。
FUN:a function to compute the summary statistics which can be applied to all data subsets.
(你需要用于)計(jì)算統(tǒng)計(jì)匯總信息的函數(shù)斯撮,會(huì)應(yīng)用于所有數(shù)據(jù)子集
......
二:應(yīng)用:
以mtcars數(shù)據(jù)集演示,按照氣缸數(shù)分組并求其他各組數(shù)據(jù)的平均值:
#mtcars:R內(nèi)置數(shù)據(jù)集扶叉,它是美國(guó)Motor Trend收集的1973到1974年期間總共32輛汽車
# 的11個(gè)指標(biāo): 油耗及10個(gè)與設(shè)計(jì)及性能方面的指標(biāo)勿锅。
# 以下是此應(yīng)用的三種寫法,可供參考:
aggregate(mtcars, by=list(cyl=mtcars$cyl), FUN=mean)
aggregate(mtcars, by=list(cyl),mean)
aggregate(.~cyl,mtcars, mean)
這三種寫法得到的結(jié)果是一樣的枣氧,都是按照cyl(氣缸數(shù))對(duì)車進(jìn)行分類(比如2缸4缸)溢十,每一類分別求其他參數(shù)(表里總共11個(gè)指標(biāo))平均數(shù)(比如2缸的車還有不同的里程數(shù)等)。下面是結(jié)果:
結(jié)果如上