以R包dplyr為例请梢,學習以下代碼
首先安裝dplyr挖藏,由于之前已經(jīng)install.packages("tidyverse")
,而tidyverse包括R包dplyr榆综,所以安裝即library(tidyverse)
后dplyr也被安裝了
1. 新增列讼溺,mutate寇荧,以iris數(shù)據(jù)集(簡版)為例,首先賦予test為iris數(shù)據(jù)集(簡版)羞海,然后mutate(test, new = Sepal.Length * Sepal.Width)
即新增了乘積的一列忌愚。
2. 按列篩選,select(test却邓, )
硕糊,空白填名稱、順序都行
3. 按行篩選腊徙,例如filter(test, Species == "setosa")
简十,然后filter(test, Species == "setosa"&Sepal.Length > 5 )
進一步篩選,縮小范圍
4. 按列對表格排序撬腾,arrange(test, Sepal.Length)
#默認從小到大排序,改變默認螟蝙,則arrange(test, desc(Sepal.Length))#表示由大到小,desc即decend后退
5. 匯總民傻,summarise(test, mean(Sepal.Length), sd(Sepal.Length))
計算Sepal.Length的平均值和標準差,也可以group_by(test, Species)
分亞之后在統(tǒng)計平均值和標準差
6. 統(tǒng)計某列的unique值胰默,如count(test,Species)
7. 將幾列數(shù)連接成表,如```test1 <- data.frame(x = c('b','e','f','x'),
z = c("A","B","C",'D'),
stringsAsFactors = F)```,包括內連接饰潜、左連接初坠、右連接、全連接等幾種形式彭雾,對映集合的幾種形式碟刺,另外用```bind_rows(test1, test2)```,```bind_cols(test1, test3)```可以分別對列相同薯酝、行相同數(shù)的表格進行合并