R語言文本合并和limma差異分析

R語言文本合并

R語言中合并方式有很多畏腕，目前我常用的有兩種：

兩個(gè)文本對象有相同的行名岗照，通過行名的匹配進(jìn)行信息合并虏缸。#比較常用于將文件2的某幾列信息添加到文件1中良姆。
兩個(gè)文本對象通過相同的列用merge進(jìn)行合并讥脐，后面主要講解merge函數(shù)遭居。

文本讀取

首先我們先進(jìn)行文本的讀取啼器，常用的文本格式主要有txt/tsv(TAB分割，制表符)俱萍，csv(逗號分隔)端壳， xlsx(二進(jìn)制文件)，前兩種R的自帶包即可讀取不用額外安裝R包枪蘑，但xlsx需要先安裝xlsx對應(yīng)的R包才能讀取损谦，下面主要對這三種格式進(jìn)行舉例。

#TAB分割文件可以通過read.delim()和read.table()讀取岳颇，讀取方式如下：

file1 <- read.delim(file="filename.txt", header=T, check.names=F, stringsAsFactors=F, row.names=1)

#header=T照捡，表示將讀進(jìn)來信息對象的第一行作為表頭，相同代碼也可以用head=1;
#check.names=F话侧，表示表頭是否調(diào)整栗精，如果是T/TRUE，第一行表頭中的 ’-/_/=‘ 等特殊字符會轉(zhuǎn)換成'.'
#如果文本中前幾列是不想要的內(nèi)容瞻鹏，可以用skip=2悲立，表示表過前兩行，那么第三行可能就作為表頭, 如果有注釋信息可以用comment.char="#"會自動(dòng)過濾開頭為#的行
#stringsAsFactors表示都進(jìn)來的每一列信息是否要因子話新博，因子這個(gè)概念比較復(fù)雜薪夕，如果理解不深刻，后續(xù)可能會有很多隱患赫悄，建議需要的時(shí)候再設(shè)定原献。
#row.names=1，表示第一類作為行名涩蜘，既然作行名嚼贡，就要求不允許有重復(fù)熏纯，否則報(bào)錯(cuò)同诫，不給此參數(shù)代表默認(rèn)行名1，2樟澜，3误窖，...
#以上參數(shù)可在多個(gè)文本讀取函數(shù)中使用，如read.table/read.csv.

####csv文本

file1 <- read.csv(file="filename.csv", header=T, check.names=F, stringsAsFactors=F, row.names=1)

####萬能讀取方式read.table

file1 <-  read.table(file="filename.txt", sep="\t")

#sep="\t", 可以設(shè)定任意的分割方式秩贰，比如sep=","霹俺；sep="-"; sep=";" 需要注意的是xlsx不支持。
#sep="\t" 等價(jià)于read.delim(); sep="," 等價(jià)于read.csv(), \
#如果用了read.csv且參數(shù)加了sep=",",那么sep=","的任何設(shè)置都是無效的毒费，且程序會報(bào)warning（此warning無影響）

####xlsx表讀取
#EXCEL表是二進(jìn)制格式的丙唧，所以需要特定的包進(jìn)行解析，常見的包有xlsx觅玻，以此為例想际。
#xlsx包的安裝請參考:(http://www.reibang.com/p/0fbf7cc52413)

library(xlsx)
file1 <- read.xlsx(“filename.xlsx”,sheetIndex=1,startRow=1,endRow=100,colIndex=1:100,encoding = "UTF-8")

#sheetIndex=1,第幾個(gè)sheet表
#startRow=1,endRow=100,colIndex=1:100,都是用于控制sheet表中讀取的行列數(shù)目

文件合并

指定列合并：

#假如兩個(gè)文件有兩列是一致的培漏，且兩列列名均為gene 或分別為"gene","symbol";
combined <- merge(x=file1,y=file2,by="gene", all=L)
combined <- merge(x=file1,y=file2,by.x="gene",by.y="symbol",all=L)
#all=L表示兩個(gè)文件匹配不上的也會保留，且用NA填充胡本，如果只保留某一個(gè)文件的所有內(nèi)容可用all.x=T or all.y=T, "L"等價(jià)于兩者同時(shí)保留

按照信息匹配：

#假如兩個(gè)文件有同一屬性的列名牌柄，比如symbol，且需要將文件2中的log2FC根據(jù)symbol加入到文件1表達(dá)信息中
要求兩列需要有相同的行數(shù)和行名順序可不一致侧甫。
file1$log2FC <- file2[rownames(file1), 'log2FC']

limma差異分析

limma 文檔
limma同時(shí)支持芯片和測序數(shù)據(jù)珊佣。

limma基本原理

從limma教程來看limma僅支持read counts和CPM輸入進(jìn)行差異分析(ReadCounts/CPM/TPM/FPKM都是些啥東東，看這里)披粟，但有相關(guān)測試說TPM和ReadCounts的測試結(jié)果基本沒差轉(zhuǎn)錄組差異分析FPKM與count處理差別
咒锻，且有相關(guān)基于FPKM轉(zhuǎn)換為TPM后進(jìn)行差異分析的文章(Front. Mol. Neurosci. IF4.8)。從以上信息可知針對測序數(shù)據(jù)limma可以支持ReadCounts/CPM/TPM/FPKM進(jìn)行差異分析守屉，但嚴(yán)謹(jǐn)?shù)恼flimma僅支持前兩者虫碉。

以下為可參考的教程或文獻(xiàn)：

RPKM/FPKM/TPM探討歸一化概念的文獻(xiàn)，文章(Theory in Biosciences IF1.1)
FPKM和TMP相互轉(zhuǎn)換胸梆，TPM敦捧、RPKM與FPKM相互轉(zhuǎn)換R代碼 - 簡書 (jianshu.com)
limma進(jìn)行差異分析，差異分析|使用limma包 - 簡書 (jianshu.com)

最后編輯于：2024.03.29 15:59:35

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末碰镜，一起剝皮案震驚了整個(gè)濱河市兢卵，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌绪颖，老刑警劉巖秽荤，帶你破解...
沈念sama閱讀 217,509評論 6贊 504
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異柠横，居然都是意外死亡窃款，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,806評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門牍氛，熙熙樓的掌柜王于貴愁眉苦臉地迎上來晨继，“玉大人，你說我怎么就攤上這事搬俊∥裳铮” “怎么了？”我有些...
開封第一講書人閱讀 163,875評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵唉擂，是天一觀的道長餐屎。經(jīng)常有香客問我，道長玩祟，這世上最難降的妖魔是什么腹缩？我笑而不...
開封第一講書人閱讀 58,441評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結(jié)果婚禮上藏鹊，老公的妹妹穿的比我還像新娘胜臊。我一直安慰自己，他們只是感情好伙判，可當(dāng)我...
茶點(diǎn)故事閱讀 67,488評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布象对。她就那樣靜靜地躺著，像睡著了一般宴抚。火紅的嫁衣襯著肌膚如雪勒魔。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,365評論 1贊 302
城市分裂傳說
那天菇曲，我揣著相機(jī)與錄音冠绢，去河邊找鬼。笑死常潮，一個(gè)胖子當(dāng)著我的面吹牛弟胀，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播喊式，決...
沈念sama閱讀 40,190評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼孵户，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了岔留？” 一聲冷哼從身側(cè)響起夏哭，我...
開封第一講書人閱讀 39,062評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎献联，沒想到半個(gè)月后竖配，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,500評論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡里逆，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,706評論 3贊 335
?白月光啟示錄
正文我和宋清朗相戀三年进胯，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片原押。...
茶點(diǎn)故事閱讀 39,834評論 1贊 347
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡胁镐，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出班眯，到底是詐尸還是另有隱情希停，我是刑警寧澤烁巫，帶...
沈念sama閱讀 35,559評論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布署隘，位于F島的核電站，受9級特大地震影響亚隙，放射性物質(zhì)發(fā)生泄漏磁餐。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,167評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望诊霹。院中可真熱鬧羞延，春花似錦、人聲如沸脾还。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,779評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽鄙漏。三九已至嗤谚，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間怔蚌，已是汗流浹背巩步。一陣腳步聲響...
開封第一講書人閱讀 32,912評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留桦踊，地道東北人椅野。一個(gè)月前我還...
沈念sama閱讀 47,958評論 2贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像籍胯，于是被迫代替她去往敵國和親竟闪。傳聞我的和親對象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,779評論 2贊 354

R語言文本合并和limma差異分析

R語言文本合并

文本讀取

文件合并

limma差異分析

推薦閱讀更多精彩內(nèi)容