第9章 數(shù)據(jù)操作
9.1 plyr包簡介
plyr包中的ddply()函數(shù)能夠同時在數(shù)據(jù)的多個子集上做統(tǒng)計匯總那伐。
ddply(.data, .variables, .fun, ...):data是用來作圖的數(shù)據(jù),variables是對數(shù)據(jù)取子集的分組變量兢榨,fun是要在各子集上運行的統(tǒng)計匯總函數(shù)。
subset() 用來對數(shù)據(jù)取子集的函數(shù)瓷炮,選擇數(shù)據(jù)中前n個(x%)個觀測值壤玫,或者再某個閾值之上或下的觀測值祟霍。
transform() 是用來進行數(shù)據(jù)變換的函數(shù),與ddply()一起可以計算分組統(tǒng)計量锌妻,例如各組的標(biāo)準(zhǔn)差代乃,并且加到原數(shù)據(jù)上。
colwise()用來向量化一個普通函數(shù)仿粹,也就是說colwise()能把原本只接受向量輸入的函數(shù)編程可接受數(shù)據(jù)框輸入的函數(shù)搁吓。
9.2 把數(shù)據(jù)化“寬”為“長”
ggplot2進行數(shù)據(jù)分組時必須根據(jù)行,而不能根據(jù)列吭历。
reshape2包中的melt()函數(shù)和cast()函數(shù)可以靈活地整理和綜合數(shù)據(jù)堕仔。
多重時間序列和平行坐標(biāo)圖的繪制,查看書籍吧晌区,不想敲字了摩骨。
9.3 ggplot()方法
fortify()的原理以及如何用它生成符合ggplot2理念的新方法。
ggplot2將數(shù)據(jù)整理和圖形顯示完全分離開了朗若。