生信星球?qū)W習(xí)第六天
學(xué)習(xí)內(nèi)容主要包括R語言的一些簡單數(shù)據(jù)處理操作卸勺,現(xiàn)在回顧一下
1.R有很多包铛楣,主要分為兩大類CRAN or Biocductor,其操作命令分別為install.package(); BioManager::install()
2. dplyr包的五個基礎(chǔ)函數(shù)
2.1 mutate(), 為新增列
2.2 select(), 按列篩選
2.3 filter ()按行篩選
2.4 arrange (),按某一列或者某幾列進(jìn)行排序
2.5 summarise ()馅笙,匯總
3.dplyr兩個實(shí)用技能
3.1 %>%,管道操作
3.2 count 統(tǒng)計(jì)某列的unique值搞糕,避免重復(fù)的列內(nèi)容出現(xiàn)
4.dplyr處理關(guān)系數(shù)據(jù)脊髓,即將兩個表連接起來
4.1 內(nèi)連inner_join,取交集
4.2 左連left_join
4.3 全連full_join
4.4半連接 返回能夠與y表匹配的x表所有記錄semi_join赁遗,只有X表的內(nèi)容會被顯示出來
4.5 反連接 anti_join, 和半連接剛好完全相反
4.6 簡單合并數(shù)據(jù)框 cbind(), rbind(); bind_rows(), bind_cols() ps: bind_rows()函數(shù)需要兩個表格列數(shù)相同署辉,而bind_cols()函數(shù)則需要兩個數(shù)據(jù)框有相同的行數(shù)
生信_20200413122153.png
加油族铆!