學(xué)習(xí)小組Day6筆記--沒有眼鏡

R包的安裝和使用(dplyr為例)

鏡像設(shè)置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
安裝

install.packages(“包”) 或者BiocManager::install(“包”)

加載

library(包) 或者
require(包)

使用

dplyr包主要用于數(shù)據(jù)清洗和整理,主要功能有:行選擇憋槐、列選擇挖帘、統(tǒng)計匯總遭赂、窗口函數(shù)吼具、數(shù)據(jù)框交集等已旧,是非常高效裕寨、友好的數(shù)據(jù)處理包先改。
以內(nèi)置數(shù)據(jù)集iris的簡化版為例
test <- iris[c(1:2,51:52,101:102),]

1. 新增列 mutate()
mutate(數(shù)據(jù)框, 列名 = 邏輯)
如: mutate(test, new = Sepal.Length * Sepal.Width)
2. 按列篩選 select()
select(數(shù)據(jù)框,1) 篩選第一列
select(數(shù)據(jù)框,c(1,5)) 篩選第一和第五列
select(數(shù)據(jù)框,列名) 按照列名篩選
篩選多個列時

vars <- c("Petal.Length", "Petal.Width")
select(test, one_of(vars))

To make your selection code more robust and silence the message, use all_of()to force the external vector.
3. 按行篩選 filter()
filter(test, Species == "setosa")
filter(test, Species == "setosa"&Sepal.Length > 5 )
filter(test, Species %in% c("setosa","versicolor"))
4. 排序 arrange()
arrange(test, Sepal.Length)
按照指定列排序疚察,默認(rèn)從小到大
arrange(test, desc(Sepal.Length))用desc從大到小排序
5. 匯總 summarise()
summarise(test, mean(Sepal.Length), sd(Sepal.Length))
計算Sepal.Length的平均值和標(biāo)準(zhǔn)差
結(jié)合group_by()分組運算
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))
先按照Species分組,計算每組Sepal.Length的平均值和標(biāo)準(zhǔn)差
6. 管道操作 %>% (cmd/ctr + shift + M)
符號%>%仇奶,這是管道操作貌嫡,其意思是將%>%左邊的對象傳遞給右邊的函數(shù),作為第一個選項的設(shè)置(或剩下唯一一個選項的設(shè)置猜嘱。
test %>% group_by(Species) %>% summarise(mean(Sepal.Length), sd(Sepal.Length))
達(dá)到與5中分組運算同樣的效果
7. 統(tǒng)計某列unique值 count()
count(test,Species)
8. 處理關(guān)系數(shù)據(jù)
將2個表進(jìn)行連接衅枫,注意:不要引入factor(options(stringsAsFactors = F)
inner_join(test1, test2, by = "x") 內(nèi)連,以指定列為準(zhǔn)取交集
left_join(test1, test2, by = 'x') 左連朗伶,以指定列為準(zhǔn)弦撩,將test2的數(shù)據(jù)補充到test1
full_join( test1, test2, by = 'x') 全連,以指定列為準(zhǔn)取并集
semi_join(x = test1, y = test2, by = 'x') 半連接论皆,返回能夠與y表匹配的x表所有記錄
anti_join(x = test2, y = test1, by = 'x') 反連接益楼,返回?zé)o法與y表匹配的x表的所記錄
bind_rows(test1, test2) 合并猾漫,需要兩個表格列數(shù)相同
bind_cols(test1, test3) 合并,需要兩個表格行數(shù)相同

以上內(nèi)容均來自于微信公眾號——生信星球

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末感凤,一起剝皮案震驚了整個濱河市悯周,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌陪竿,老刑警劉巖禽翼,帶你破解...
    沈念sama閱讀 218,036評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異族跛,居然都是意外死亡闰挡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,046評論 3 395
  • 文/潘曉璐 我一進(jìn)店門礁哄,熙熙樓的掌柜王于貴愁眉苦臉地迎上來长酗,“玉大人,你說我怎么就攤上這事桐绒《崞ⅲ” “怎么了?”我有些...
    開封第一講書人閱讀 164,411評論 0 354
  • 文/不壞的土叔 我叫張陵茉继,是天一觀的道長咧叭。 經(jīng)常有香客問我,道長馒疹,這世上最難降的妖魔是什么佳簸? 我笑而不...
    開封第一講書人閱讀 58,622評論 1 293
  • 正文 為了忘掉前任乙墙,我火速辦了婚禮颖变,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘听想。我一直安慰自己腥刹,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,661評論 6 392
  • 文/花漫 我一把揭開白布汉买。 她就那樣靜靜地躺著衔峰,像睡著了一般。 火紅的嫁衣襯著肌膚如雪蛙粘。 梳的紋絲不亂的頭發(fā)上垫卤,一...
    開封第一講書人閱讀 51,521評論 1 304
  • 那天,我揣著相機與錄音出牧,去河邊找鬼穴肘。 笑死,一個胖子當(dāng)著我的面吹牛舔痕,可吹牛的內(nèi)容都是我干的评抚。 我是一名探鬼主播豹缀,決...
    沈念sama閱讀 40,288評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼慨代!你這毒婦竟也來了邢笙?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,200評論 0 276
  • 序言:老撾萬榮一對情侶失蹤侍匙,失蹤者是張志新(化名)和其女友劉穎氮惯,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體想暗,經(jīng)...
    沈念sama閱讀 45,644評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡筐骇,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,837評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了江滨。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片铛纬。...
    茶點故事閱讀 39,953評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖唬滑,靈堂內(nèi)的尸體忽然破棺而出告唆,到底是詐尸還是另有隱情,我是刑警寧澤晶密,帶...
    沈念sama閱讀 35,673評論 5 346
  • 正文 年R本政府宣布擒悬,位于F島的核電站,受9級特大地震影響稻艰,放射性物質(zhì)發(fā)生泄漏懂牧。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,281評論 3 329
  • 文/蒙蒙 一尊勿、第九天 我趴在偏房一處隱蔽的房頂上張望僧凤。 院中可真熱鬧,春花似錦元扔、人聲如沸躯保。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,889評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽途事。三九已至,卻和暖如春擅羞,著一層夾襖步出監(jiān)牢的瞬間尸变,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,011評論 1 269
  • 我被黑心中介騙來泰國打工减俏, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留召烂,地道東北人。 一個月前我還...
    沈念sama閱讀 48,119評論 3 370
  • 正文 我出身青樓垄懂,卻偏偏與公主長得像骑晶,于是被迫代替她去往敵國和親痛垛。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,901評論 2 355

推薦閱讀更多精彩內(nèi)容