學習小組Day6--琛

學習小組Day6.png

學習R包

準備工作

  • 鏡像設置
  • 安裝
    install.packages("包")
    Biocmanager::install("包")
    用什么代碼取決于要安裝的包在什么網(wǎng)站
  • 加載
    library(包)
    require(包)

dplyr五個基本函數(shù)

  1. mutate() 新增列
    mutate(test, name = Sepal.Length * Sepal.Width)
    image.png

    !注意:新增的列是沒有保存在原數(shù)據(jù)框里的杜耙,若想保存下來新增的列搜骡,可以給原數(shù)據(jù)框賦值,或者新賦值一個數(shù)據(jù)框
image.png
  1. select() 按列篩選
    2.1 按列號篩選 select(test,1)
    2.2 按列名篩選 select(test, Petal.Length, Petal.Width)
    ?one_of

  2. filter()篩選行

filter(test, Species == "setosa") #篩選Species為setosa的行
filter(test, Species == "setosa"&Sepal.Length > 5 ) #篩選Species為setosa且 Sepal.Length大于5的行
filter(test, Species %in% c("setosa","versicolor")) #篩選Species為setosa和versicolor的行
  1. arrange()按列排序
arrange(test, Sepal.Length) #按Sepal.Length 這列升序排序
arrange(test, Sepal.Length, Sepal.Width) #先按Sepal.Length升序佑女,當數(shù)值一樣時按Sepal.Width升序
arrange(test, desc(Sepal.Length)) #按Sepal.Length降序
  1. summarise()對數(shù)據(jù)進行總結
    ie.summarise(test, mean(Sepal.Length), sd(Sepal.Length)) #test中Sepal.Length的平均值和方差
    可以和group_by()結合使用
    summarise(group_by(test,Species), mean(Sepal.Length), sd(Sepal.Length))
    將test中的數(shù)據(jù)按照Species分類记靡,然后分別計算每類Sepal.Length的平均值和方差
    image.png

dplyr兩個使用技能

管道操作

%>%
ctrl + shift + M
將上一個函數(shù)的輸出作為下一個函數(shù)的輸入
test %>% # 輸出結果為test這個數(shù)據(jù)框
+ group_by(Species) %>% # 輸入test這個數(shù)據(jù)框,輸出group_by(test,Species)
+ summarise(mean(Sepal.Length), sd(Sepal.Length)) # 輸入group_by(test,Species)的結果团驱,輸出summarise(group_by(test,Species), mean(Sepal.Length), sd(Sepal.Length))
所以

test %>% 
+ group_by(Species) %>% 
+ summarise(mean(Sepal.Length), sd(Sepal.Length))

就等于
summarise(group_by(test,Species), mean(Sepal.Length), sd(Sepal.Length))

count統(tǒng)計某列的unique值

count(test,Species)

dplyr處理關系數(shù)據(jù)

將兩個表進行連接
新賦值兩個數(shù)據(jù)框

test1 <- data.frame(x = c('b','e','f','x'), 
+                     z = c("A","B","C",'D'))
test2 <- data.frame(x = c('a','b','c','d','e','f'), 
+                          y = c(1,2,3,4,5,6))

取交集inner_join()

inner_join(test1, test2, by = "x")
根據(jù)x列取test1和test2的交集

向左連接left_join()

> left_join(test1, test2, by = 'y')
Error in `left_join()`:
! Join columns must be present in data.
? Problem with `y`.
Run `rlang::last_error()` to see where the error occurred. # 只有兩個數(shù)據(jù)框都有同一列的時候才能連接
> left_join(test1, test2, by = 'x')
  x z  y
1 b A  2
2 e B  5
3 f C  6
4 x D NA # 在此顯示為NA摸吠,而在下方顯示為<NA>是因為y的類型為numeric,而z的類型為character
> left_join(test2, test1, by = 'x')
  x y    z
1 a 1 <NA>
2 b 2    A
3 c 3 <NA>
4 d 4 <NA>
5 e 5    B
6 f 6    C

全連接full_join()

full_join(test1,test2,by='x')
  x    z  y
1 b    A  2
2 e    B  5
3 f    C  6
4 x    D NA
5 a <NA>  1
6 c <NA>  3
7 d <NA>  4
> full_join(test2,test1,by='x')
  x  y    z
1 a  1 <NA>
2 b  2    A
3 c  3 <NA>
4 d  4 <NA>
5 e  5    B
6 f  6    C
7 x NA    D

半連接semi_join()

semi_join(x=,y=,copy=copy)
基于第二個數(shù)據(jù)集的信息來過濾第一個數(shù)據(jù)集的數(shù)據(jù)嚎花。

semi_join(test1,test2, by = 'x')
  x z
1 b A
2 e B
3 f C
> semi_join(test2,test1, by = 'x')
  x y
1 b 2
2 e 5
3 f 6

反連接anti_join()

找出合并時哪些行不能匹配第二個數(shù)據(jù)集

anti_join(test2, test1, by = 'x')
  x y
1 a 1
2 c 3
3 d 4
> anti_join(test1, test2, by = 'x')
  x z
1 x D

簡單合并

  1. bind_rows()
    需要兩個數(shù)據(jù)框列數(shù)相同
  2. bind_cols()
    需要兩個數(shù)據(jù)框行數(shù)相同
最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末寸痢,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子紊选,更是在濱河造成了極大的恐慌啼止,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件兵罢,死亡現(xiàn)場離奇詭異献烦,居然都是意外死亡,警方通過查閱死者的電腦和手機卖词,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進店門仿荆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人坏平,你說我怎么就攤上這事拢操。” “怎么了舶替?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵令境,是天一觀的道長。 經(jīng)常有香客問我顾瞪,道長舔庶,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任陈醒,我火速辦了婚禮惕橙,結果婚禮上,老公的妹妹穿的比我還像新娘钉跷。我一直安慰自己弥鹦,他們只是感情好,可當我...
    茶點故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著彬坏,像睡著了一般朦促。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上栓始,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天务冕,我揣著相機與錄音,去河邊找鬼幻赚。 笑死禀忆,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的落恼。 我是一名探鬼主播油湖,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼领跛!你這毒婦竟也來了乏德?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤吠昭,失蹤者是張志新(化名)和其女友劉穎喊括,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體矢棚,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡郑什,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了蒲肋。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蘑拯。...
    茶點故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖兜粘,靈堂內(nèi)的尸體忽然破棺而出申窘,到底是詐尸還是另有隱情,我是刑警寧澤孔轴,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布剃法,位于F島的核電站,受9級特大地震影響路鹰,放射性物質(zhì)發(fā)生泄漏贷洲。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一晋柱、第九天 我趴在偏房一處隱蔽的房頂上張望优构。 院中可真熱鬧,春花似錦雁竞、人聲如沸钦椭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽玉凯。三九已至势腮,卻和暖如春联贩,著一層夾襖步出監(jiān)牢的瞬間漫仆,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工泪幌, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留盲厌,地道東北人。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓祸泪,卻偏偏與公主長得像吗浩,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子没隘,可洞房花燭夜當晚...
    茶點故事閱讀 42,700評論 2 345