R語言文本合并和limma差異分析

R語言文本合并

R語言中合并方式有很多畏腕,目前我常用的有兩種:

  1. 兩個(gè)文本對象有相同的行名岗照,通過行名的匹配進(jìn)行信息合并虏缸。#比較常用于將文件2的某幾列信息添加到文件1中良姆。
  2. 兩個(gè)文本對象通過相同的列用merge進(jìn)行合并讥脐,后面主要講解merge函數(shù)遭居。

文本讀取

首先我們先進(jìn)行文本的讀取啼器,常用的文本格式主要有txt/tsv(TAB分割,制表符)俱萍,csv(逗號分隔)端壳, xlsx(二進(jìn)制文件),前兩種R的自帶包即可讀取不用額外安裝R包枪蘑,但xlsx需要先安裝xlsx對應(yīng)的R包才能讀取损谦,下面主要對這三種格式進(jìn)行舉例。

#TAB分割文件可以通過read.delim()和read.table()讀取岳颇,讀取方式如下:

file1 <- read.delim(file="filename.txt", header=T, check.names=F, stringsAsFactors=F, row.names=1)

#header=T照捡,表示將讀進(jìn)來信息對象的第一行作為表頭,相同代碼也可以用head=1;
#check.names=F话侧,表示表頭是否調(diào)整栗精,如果是T/TRUE,第一行表頭中的 ’-/_/=‘ 等特殊字符會轉(zhuǎn)換成'.'
#如果文本中前幾列是不想要的內(nèi)容瞻鹏,可以用skip=2悲立,表示表過前兩行,那么第三行可能就作為表頭, 如果有注釋信息可以用comment.char="#"會自動(dòng)過濾開頭為#的行
#stringsAsFactors表示都進(jìn)來的每一列信息是否要因子話新博,因子這個(gè)概念比較復(fù)雜薪夕,如果理解不深刻,后續(xù)可能會有很多隱患赫悄,建議需要的時(shí)候再設(shè)定原献。
#row.names=1,表示第一類作為行名涩蜘,既然作行名嚼贡,就要求不允許有重復(fù)熏纯,否則報(bào)錯(cuò)同诫,不給此參數(shù)代表默認(rèn)行名1,2樟澜,3误窖,...
#以上參數(shù)可在多個(gè)文本讀取函數(shù)中使用,如read.table/read.csv.

####csv文本

file1 <- read.csv(file="filename.csv", header=T, check.names=F, stringsAsFactors=F, row.names=1)

####萬能讀取方式read.table

file1 <-  read.table(file="filename.txt", sep="\t")

#sep="\t", 可以設(shè)定任意的分割方式秩贰,比如sep=","霹俺;sep="-"; sep=";" 需要注意的是xlsx不支持。
#sep="\t" 等價(jià)于read.delim(); sep="," 等價(jià)于read.csv(), \
#如果用了read.csv且參數(shù)加了sep=",",那么sep=","的任何設(shè)置都是無效的毒费,且程序會報(bào)warning(此warning無影響)

####xlsx表讀取
#EXCEL表是二進(jìn)制格式的丙唧,所以需要特定的包進(jìn)行解析,常見的包有xlsx觅玻,以此為例想际。
#xlsx包的安裝請參考:(http://www.reibang.com/p/0fbf7cc52413)

library(xlsx)
file1 <- read.xlsx(“filename.xlsx”,sheetIndex=1,startRow=1,endRow=100,colIndex=1:100,encoding = "UTF-8")

#sheetIndex=1,第幾個(gè)sheet表
#startRow=1,endRow=100,colIndex=1:100,都是用于控制sheet表中讀取的行列數(shù)目

文件合并

指定列合并:

#假如兩個(gè)文件有兩列是一致的培漏,且兩列列名均為gene 或分別為"gene","symbol";
combined <- merge(x=file1,y=file2,by="gene", all=L)
combined <- merge(x=file1,y=file2,by.x="gene",by.y="symbol",all=L)
#all=L表示兩個(gè)文件匹配不上的也會保留,且用NA填充胡本,如果只保留某一個(gè)文件的所有內(nèi)容可用all.x=T or all.y=T, "L"等價(jià)于兩者同時(shí)保留

按照信息匹配:

#假如兩個(gè)文件有同一屬性的列名牌柄,比如symbol,且需要將文件2中的log2FC根據(jù)symbol加入到文件1表達(dá)信息中
要求兩列需要有相同的行數(shù)和行名順序可不一致侧甫。
file1$log2FC <- file2[rownames(file1), 'log2FC']

limma差異分析

limma 文檔
limma同時(shí)支持芯片和測序數(shù)據(jù)珊佣。

limma基本原理

從limma教程來看limma僅支持read counts和CPM輸入進(jìn)行差異分析(ReadCounts/CPM/TPM/FPKM都是些啥東東,看這里)披粟,但有相關(guān)測試說TPM和ReadCounts的測試結(jié)果基本沒差轉(zhuǎn)錄組差異分析FPKM與count處理差別
咒锻,且有相關(guān)基于FPKM轉(zhuǎn)換為TPM后進(jìn)行差異分析的文章(Front. Mol. Neurosci. IF4.8)。從以上信息可知針對測序數(shù)據(jù)limma可以支持ReadCounts/CPM/TPM/FPKM進(jìn)行差異分析守屉,但嚴(yán)謹(jǐn)?shù)恼flimma僅支持前兩者虫碉。

以下為可參考的教程或文獻(xiàn):

  1. RPKM/FPKM/TPM探討歸一化概念的文獻(xiàn),文章(Theory in Biosciences IF1.1)
  2. FPKM和TMP相互轉(zhuǎn)換胸梆,TPM敦捧、RPKM與FPKM相互轉(zhuǎn)換R代碼 - 簡書 (jianshu.com)
  3. limma進(jìn)行差異分析,差異分析|使用limma包 - 簡書 (jianshu.com)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末碰镜,一起剝皮案震驚了整個(gè)濱河市兢卵,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌绪颖,老刑警劉巖秽荤,帶你破解...
    沈念sama閱讀 217,509評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異柠横,居然都是意外死亡窃款,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評論 3 394
  • 文/潘曉璐 我一進(jìn)店門牍氛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來晨继,“玉大人,你說我怎么就攤上這事搬俊∥裳铮” “怎么了?”我有些...
    開封第一講書人閱讀 163,875評論 0 354
  • 文/不壞的土叔 我叫張陵唉擂,是天一觀的道長餐屎。 經(jīng)常有香客問我,道長玩祟,這世上最難降的妖魔是什么腹缩? 我笑而不...
    開封第一講書人閱讀 58,441評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上藏鹊,老公的妹妹穿的比我還像新娘胜臊。我一直安慰自己,他們只是感情好伙判,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,488評論 6 392
  • 文/花漫 我一把揭開白布象对。 她就那樣靜靜地躺著,像睡著了一般宴抚。 火紅的嫁衣襯著肌膚如雪勒魔。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,365評論 1 302
  • 那天菇曲,我揣著相機(jī)與錄音冠绢,去河邊找鬼。 笑死常潮,一個(gè)胖子當(dāng)著我的面吹牛弟胀,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播喊式,決...
    沈念sama閱讀 40,190評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼孵户,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了岔留?” 一聲冷哼從身側(cè)響起夏哭,我...
    開封第一講書人閱讀 39,062評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎献联,沒想到半個(gè)月后竖配,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,500評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡里逆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,706評論 3 335
  • 正文 我和宋清朗相戀三年进胯,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片原押。...
    茶點(diǎn)故事閱讀 39,834評論 1 347
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡胁镐,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出班眯,到底是詐尸還是另有隱情希停,我是刑警寧澤烁巫,帶...
    沈念sama閱讀 35,559評論 5 345
  • 正文 年R本政府宣布署隘,位于F島的核電站,受9級特大地震影響亚隙,放射性物質(zhì)發(fā)生泄漏磁餐。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,167評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望诊霹。 院中可真熱鬧羞延,春花似錦、人聲如沸脾还。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,779評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽鄙漏。三九已至嗤谚,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間怔蚌,已是汗流浹背巩步。 一陣腳步聲響...
    開封第一講書人閱讀 32,912評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留桦踊,地道東北人椅野。 一個(gè)月前我還...
    沈念sama閱讀 47,958評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像籍胯,于是被迫代替她去往敵國和親竟闪。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,779評論 2 354

推薦閱讀更多精彩內(nèi)容