提取列
對列進(jìn)行選擇 select 函數(shù)
提取行
對行進(jìn)行選擇 filter 函數(shù)
slice():按位置提取行
filter():提取符合特定邏輯條件的行。 例如赁酝,iris%>%filter(Sepal.Length> 6)荒典。
filter_all()偎痛,filter_if()和filter_at():過濾變量然后選擇行决左。 這些函數(shù)復(fù)制所有變量或變量選擇的邏輯標(biāo)準(zhǔn)撒踪。
sample_n():隨機(jī)選擇n行
sample_frac():隨機(jī)選擇一小部分行
top_n():選擇變量排序的前n行
根據(jù)某一列合并表格
# 保存左側(cè)完整表格
left_join(table1,table2,by="相同的列名") # 兩列列名稱不同使用(c ("X1"="Y1"))
right_join # 保存右側(cè)
full_join # 取并集
inner_join # 取交集
刪除重復(fù)行
# 根據(jù)所有列刪除重復(fù)的行(完全一樣的觀測值):
my_data %>% distinct()
# 根據(jù)特定列刪除重復(fù)值
my_data %>% distinct(Sepal.Length, .keep_all = TRUE)
# 根據(jù)多列刪除重復(fù)值
my_data %>% distinct(Sepal.Length, Petal.Width, .keep_all = TRUE)
# 選項.kep_all用于保留數(shù)據(jù)中的所有變量塞颁。
根據(jù)一個或多個列值刪除重復(fù)行:my_data%>%dplyr :: distinct(Sepal.Length)
R base函數(shù)從向量和數(shù)據(jù)幀中提取唯一元素:unique(my_data)
R基函數(shù)確定重復(fù)元素:duplicated(my_data)
對某一列重命名
colnames(表格名稱)[列數(shù)] <-"重命名"
colnames(gene_raw_express_data)[1] <-"Gene_ID"