一撰豺、安裝和加載R包
- 鏡像設(shè)置
鏡像設(shè)置.png
- 安裝R包
- R包存在與CRAN:install.packages(“R包名稱”)
- R包存在于Biocductor:BiocManager::install(“R包名稱”)
安裝R包.png
- 加載R包
加載R包.png
二、dplyr(數(shù)據(jù)操作R包)五個(gè)基礎(chǔ)函數(shù)
- 新增列:mutate()
新增列.png
- 按列篩選:select()
篩選列.png
- 篩選行:filter()
篩選行.png
- 按某1列或某幾列對整個(gè)表格進(jìn)行排序:arrange()
表格排序.png
- 匯總分析:summarise()拼余,再加上分組group_by()即可實(shí)現(xiàn)各組內(nèi)分析
匯總分析.png
三郑趁、dplyr兩個(gè)擴(kuò)展技巧
- 管道操作
- 能夠通過管道將數(shù)據(jù)從一個(gè)函數(shù)傳給另外一個(gè)函數(shù),從而用若干函數(shù)構(gòu)成的管道依次變換你的數(shù)據(jù)
- 管道運(yùn)算符號為%>%(Windows快捷鍵為Shift+CTRL+M)姿搜,其意思是將左邊的運(yùn)算結(jié)果,以輸入的方式傳遞給右邊的函數(shù)
管道操作.png
- count() :統(tǒng)計(jì)某列的unique值
統(tǒng)計(jì)某一列各元素出現(xiàn)次數(shù).png
四捆憎、dplyr處理關(guān)系數(shù)據(jù)-類似于Excel的VLOOKUP
- 取兩個(gè)數(shù)據(jù)在某一變量上的的交集:inner_join(X,Y,by = '某一變量')
找出兩個(gè)數(shù)據(jù)集在某一變量上的交集.png
- 將兩個(gè)數(shù)據(jù)集以左側(cè)數(shù)據(jù)集為標(biāo)準(zhǔn)取交集:left_join(X,Y, by = '某一變量')
左連.png
- 將兩個(gè)數(shù)據(jù)集整體合并:full_join(X,Y, by = '某一變量')
全連.png
- 返回能夠與Y表匹配的X表所有記錄:semi_join(X, Y, by = '某一變量')
半合并.png
- 返回?zé)o法與Y表匹配的X表的所有記錄:anti_join(X, Y, by = '某一變量')
反連接.png
- 簡單合并
- bind_rows()函數(shù)需要兩個(gè)表格列數(shù)相同
- bind_cols()函數(shù)則需要兩個(gè)數(shù)據(jù)框有相同的行數(shù)
簡單合并.png