R語言學(xué)習(xí)----dplyr包中的join系列函數(shù)學(xué)習(xí)

1.dplyr包介紹

對于數(shù)據(jù)分析工作者來說,前期數(shù)據(jù)的清洗挂据、處理及變換等占據(jù)了整個工作流程一大半的時間以清。因此,為了提高工作效率崎逃,R語言包dplyr應(yīng)運(yùn)而生掷倔。這是一個專注dataframe對象的數(shù)據(jù)處理包,它功能強(qiáng)大个绍。下面簡單介紹該包中的幾個join數(shù)據(jù)連接函數(shù)勒葱。

2.join系列函數(shù)介紹

2.1合并連接

合并連接包括內(nèi)連接和外連接浪汪。

2.1.1inner_join----內(nèi)連接

內(nèi)連接保留A,B中相匹配(同)的觀測值(相當(dāng)于找交集),結(jié)果是一個new dataframe凛虽。

file
file

2.1.2 三種外連接

外連接包含三種left_join,right_join,full_join下面一一介紹死遭。

2.1.2.1left_join----左連接

B中未匹配的觀測值丟棄(以NA填充),A中未匹配的保留凯旋。


file

file

2.1.2.2 right_join----右連接

A中未匹配的觀測值丟棄(以NA填充)呀潭,B中未匹配的保留。


file
file

2.1.2.3 full_join----全連接

A跟B中的都保留下來(相當(dāng)于并集)至非。

file

file

2.2 篩選連接

2.2.1 semi_join----半連接

相當(dāng)于以B為篩選標(biāo)準(zhǔn)蜗侈,保留A與B相同的觀測。(把B中有的A中沒有的去掉)

file

2.2.1 anti_join----反連接

相當(dāng)于以B為篩選標(biāo)準(zhǔn)睡蟋,保留A中有而B中沒有的觀測踏幻。

file

3 連接實(shí)際應(yīng)用

R中連接比較實(shí)用,可用于找兩個文件中相同的戳杀,也可以找兩個文件之中其中一個特有的等等该面。下面以一個實(shí)例來介紹下連接的應(yīng)用。

#需求1:提取兩個csv文件的某列相同的部分到一個新的csv文件中信卡。
#需求2:提取兩個csv文件中某列特有的部分(另外一列沒有)隔缀。

#dplyr包的安裝和加載
install.packages("dplyr")
library(dplyr)
#讀取兩個csv文件
df1<-read.csv("/Users/bcl/Desktop/DEG_treat_vs_control.csv")
df2<-read.csv("/Users/bcl/Desktop/DEG_treat_vs_control 1.csv")
#使用dplyr包預(yù)處理時建議使用tbl_df()函數(shù)或tbl_cube()函數(shù)或tbl_sql()函數(shù)將原數(shù)據(jù)轉(zhuǎn)換為tbl對象
#提取第一列
df3<-tbl_df(df1[,1])
df4<-tbl_df(df2[,1])
#內(nèi)連接找到交集
df_same<-inner_join(df3,df4)
#反連接找到特有集
df_different<-anti_join(df4,df3)          #以后面一個參數(shù)為篩選標(biāo)準(zhǔn),把前一個中特有的保留下來傍菇。
#寫入csv文件
write.table(df_same,file="/Users/bcl/Desktop/same_DEG.csv",row.names=FALSE,quote=FALSE,sep=",")
write.table(df_different,file="/Users/bcl/Desktop/different_DEG.csv",row.names=FALSE,quote=FALSE,sep=",")

前兩張圖為待操作的csv文件的部分內(nèi)容猾瘸,第三張圖為找到的兩個文件共有的部分,第四張圖為找到的第二個文件特有的丢习。

file
file
file
file

本文由博客一文多發(fā)平臺 OpenWrite 發(fā)布牵触!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市咐低,隨后出現(xiàn)的幾起案子揽思,更是在濱河造成了極大的恐慌,老刑警劉巖见擦,帶你破解...
    沈念sama閱讀 219,188評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件钉汗,死亡現(xiàn)場離奇詭異,居然都是意外死亡鲤屡,警方通過查閱死者的電腦和手機(jī)损痰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來酒来,“玉大人卢未,你說我怎么就攤上這事∫凼祝” “怎么了尝丐?”我有些...
    開封第一講書人閱讀 165,562評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長衡奥。 經(jīng)常有香客問我爹袁,道長,這世上最難降的妖魔是什么矮固? 我笑而不...
    開封第一講書人閱讀 58,893評論 1 295
  • 正文 為了忘掉前任失息,我火速辦了婚禮,結(jié)果婚禮上档址,老公的妹妹穿的比我還像新娘盹兢。我一直安慰自己,他們只是感情好守伸,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,917評論 6 392
  • 文/花漫 我一把揭開白布绎秒。 她就那樣靜靜地躺著,像睡著了一般尼摹。 火紅的嫁衣襯著肌膚如雪见芹。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,708評論 1 305
  • 那天蠢涝,我揣著相機(jī)與錄音玄呛,去河邊找鬼。 笑死和二,一個胖子當(dāng)著我的面吹牛徘铝,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播惯吕,決...
    沈念sama閱讀 40,430評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼惕它,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了废登?” 一聲冷哼從身側(cè)響起怠缸,我...
    開封第一講書人閱讀 39,342評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎钳宪,沒想到半個月后揭北,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,801評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡吏颖,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,976評論 3 337
  • 正文 我和宋清朗相戀三年搔体,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片半醉。...
    茶點(diǎn)故事閱讀 40,115評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡疚俱,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出缩多,到底是詐尸還是另有隱情呆奕,我是刑警寧澤养晋,帶...
    沈念sama閱讀 35,804評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站梁钾,受9級特大地震影響绳泉,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜姆泻,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,458評論 3 331
  • 文/蒙蒙 一零酪、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧拇勃,春花似錦四苇、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,008評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至瓣赂,卻和暖如春罗售,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背钩述。 一陣腳步聲響...
    開封第一講書人閱讀 33,135評論 1 272
  • 我被黑心中介騙來泰國打工寨躁, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人牙勘。 一個月前我還...
    沈念sama閱讀 48,365評論 3 373
  • 正文 我出身青樓职恳,卻偏偏與公主長得像,于是被迫代替她去往敵國和親方面。 傳聞我的和親對象是個殘疾皇子放钦,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,055評論 2 355

推薦閱讀更多精彩內(nèi)容