RNA-seq:Kallisto+Sleuth (2)

Kallisto下游推薦的分析軟件是Sleuth哨免,所以我們本次介紹如何使用Sleuth進行相關(guān)的分析。

RNA-seq在完成轉(zhuǎn)錄本的鑒定及定量后呛伴,我們經(jīng)常做的分析之一就是差異表達霜幼。通常我們使用較多的有以下工具:

而Kallisto主要推薦的下游分析軟件是Sleuth這個R包。Sleuth與其他常用的包進行比較其結(jié)果還是很不錯的蜻牢。

下面我們來介紹一下該包的使用。

Sleuth的安裝

source("http://bioconductor.org/biocLite.R")
biocLite("rhdf5")
install.packages("devtools")
devtools::install_github("pachterlab/sleuth")

如果你安裝了conda偏陪,也可以通過命令行的方式安裝conda install --channel bioconda r-sleuth

Sleuth的使用

#設(shè)置kallisto生成的路徑
base_dir <- "/home/617/sleuth_analysis/kallisto_qaunt_output"
#獲取所有的simple_id,具體可以看一些file.path命令的使用
sample_id <- dir(file.path(base_dir))
sample_id
## [1] "WT_1" "WT_2" "WT_3" Mutation_1"
## [5] "Mutation_2" Muatation_3"
#獲取結(jié)果文件的路徑
kal_dirs <- sapply(sample_id, function(id) file.path(base_dir, id))
kal_dirs
##                                                  WT_1 
## "/home/617/sleuth_analysis/kallisto_qaunt_output/WT_1" 
##                                                  WT_2
## "/home/617/sleuth_analysis/kallisto_qaunt_output/WT_2" 
##                                                  WT_3 
## "/home/617/sleuth_analysis/kallisto_qaunt_output/WT_3" 
##                                                  Mutation_1 
## "/home/617/sleuth_analysis/kallisto_qaunt_output/Mutation_1" 
##                                                  Mutation_2
## "/home/617/sleuth_analysis/kallisto_qaunt_output/Mutation_2" 
##                                                  Mutation_3
## "/home/617/sleuth_analysis/kallisto_qaunt_output/Mutation_3"

#讀取實驗設(shè)計表
s2c <- read.table("./design_matrix.txt", header = TRUE, sep='\t',stringsAsFactors=FALSE)
s2c
##           sample condition reps
## 1 WT_1        WT    1
## 2 WT_2        WT    2
## 3 WT_3        WT    3
## 4 Mutation_1        Mutation    1
## 5 Mutation_2        Mutation    2
## 6 Mutation_3        Mutation    3
#與路徑合并
s2c <- dplyr::mutate(s2c, path = kal_dirs)
print(s2c)
##           sample condition reps
## 1 WT_1        WT    1
## 2 WT_2        WT    2
## 3 WT_3        WT    3
## 4 Mutation_1        Mutation    1
## 5 Mutation_2        Mutation    2
## 6 Mutation_3        Mutation    3
##                                                                 path
## 1 /home/617/sleuth_analysis/kallisto_qaunt_output/WT_1
## 2 /home/617/sleuth_analysis/kallisto_qaunt_output/WT_2
## 3 /home/617/sleuth_analysis/kallisto_qaunt_output/WT_3
## 4 /home/617/sleuth_analysis/kallisto_qaunt_output/Mutation_1
## 5 /home/617/sleuth_analysis/kallisto_qaunt_output/IMutation_2
## 6 /home/617/sleuth_analysis/kallisto_qaunt_output/Mutation_3

#獲取轉(zhuǎn)錄本ID信息
#方法一:基于biomart
library(biomaRt)
#change to genename
mart <- biomaRt::useMart(biomart = "ENSEMBL_MART_ENSEMBL",
                         dataset = "hsapiens_gene_ensembl",
                         host = 'ensembl.org')
t2g <- biomaRt::getBM(attributes = c("ensembl_transcript_id", "ensembl_gene_id",
                                     "external_gene_name"), mart = mart)
t2g <- dplyr::rename(t2g, target_id = ensembl_transcript_id,
                     ens_gene = ensembl_gene_id, ext_gene = external_gene_name)
#方法二:下載EnsDb.Hsapiens.v75或者其他版本相應(yīng)的R包
library('EnsDb.Hsapiens.v75')
library('ensembldb')
mmsdb<- EnsDb.Hsapiens.v75
tx.mms<- transcripts(mmsdb, return.type = "DataFrame")
tx.mms<- tx.mms[, c("tx_id", "gene_id")]  
gene.mms<- genes(mmsdb, return.type = "DataFrame") 
gene.mms<- gene.mms[, c("gene_id", "symbol")]  
tx2genes.mms <- merge(tx.mms, gene.mms, by = "gene_id") 
t2g <- tx2genes.mms[, 2:3]
#方法三:自己制作相應(yīng)的txt文件第一列為target_id孩饼,第二列為對應(yīng)的gene(可以用ID或者是Symbol)
t2g <- read.table("./t2g.txt", header = TRUE, stringsAsFactors=FALSE)

#讀取Kallisto結(jié)果文件
#如果之前在kallisto quant沒有設(shè)置-b參數(shù)該步會報錯
library(sleuth)
so <- sleuth_prep(s2c, ~ condition, target_mapping = t2g, extra_bootstrap_summary = TRUE)

#如果想要將一個基因的不同轉(zhuǎn)錄本合并,可以按照以下模式導入
so <- sleuth_prep(s2c, ~ condition, target_mapping = t2g, extra_bootstrap_summary = TRUE,gene_mode=T,aggregation_column = 'ext_gene')

#建立模型竹挡,該步通過依據(jù)不同實驗條件下(WT與Mutation)的數(shù)據(jù)構(gòu)建線性模型,以“smooth”每個樣品的原始kallisto豐度估計值立膛。
so <- sleuth_fit(so)
#為了鑒定不同組差異表達的轉(zhuǎn)錄本揪罕,sleuth進行第二次擬合即“reduced”模型,該模型假設(shè)兩種條件下的豐度相等宝泵。然后Sleuth將識別與“full”模型明顯更好擬合的轉(zhuǎn)錄本好啰,即在假設(shè)豐度相等的情況下與reduced模型擬合度低,而加入變量不同的實驗條件后與full模型的擬合度高儿奶,說明該轉(zhuǎn)錄本/基因表達有差異框往。
so <- sleuth_fit(so, ~1, 'reduced')
#Sleuth采取 likelihood ratio test(LRT) 進行鑒定
so <- sleuth_lrt(so, 'reduced', 'full')
#可以使用models()查看不同的模型
models(so)
## [  full  ]
## formula:  ~condition 
## coefficients:
##  (Intercept)
##      conditionWW
## [  reduced  ]
## formula:  ~1 
## coefficients:
##  (Intercept)

# LRT檢驗結(jié)果
sleuth_table <- sleuth_results(so, 'reduced:full', 'lrt', show_all = FALSE)
sleuth_significant <- dplyr::filter(sleuth_table, qval <= 0.05)

#Sleuth還提供了Wald test。該函數(shù)計算每個轉(zhuǎn)錄本上一個特定'beta'系數(shù)的Wald檢驗;這提供了β值闯捎,它們是成對比較的fold change偏差值椰弊。
so <- sleuth_wt(so,'conditionWT','full')
results_table <- sleuth_results(so, 'conditionWT', test_type = 'wt')
sleuth_significant <- dplyr::filter(results_table, qval <= 0.05)

#如何導出基因表達量TPM
sleuth_geneexp<-sleuth_to_matrix(so,'obs_norm', 'tpm')



以上就是Sleuth 的應(yīng)用。如果你依然還是想要使用經(jīng)典的DESeq2瓤鼻,你可以這樣導入文件:

library(tximport)
library(DESeq2)
txi<-tximport(files=kal_dirs,type='kallisto',tx2gene=t2g)
dds1<-DESeqDataSetFromTximport(txi,s2c,~condition)

然后就可使用DESeq2進行下游的分析秉版。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市茬祷,隨后出現(xiàn)的幾起案子清焕,更是在濱河造成了極大的恐慌,老刑警劉巖祭犯,帶你破解...
    沈念sama閱讀 218,858評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件秸妥,死亡現(xiàn)場離奇詭異,居然都是意外死亡沃粗,警方通過查閱死者的電腦和手機粥惧,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,372評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來陪每,“玉大人影晓,你說我怎么就攤上這事镰吵。” “怎么了挂签?”我有些...
    開封第一講書人閱讀 165,282評論 0 356
  • 文/不壞的土叔 我叫張陵疤祭,是天一觀的道長。 經(jīng)常有香客問我饵婆,道長勺馆,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,842評論 1 295
  • 正文 為了忘掉前任侨核,我火速辦了婚禮草穆,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘搓译。我一直安慰自己悲柱,他們只是感情好,可當我...
    茶點故事閱讀 67,857評論 6 392
  • 文/花漫 我一把揭開白布些己。 她就那樣靜靜地躺著豌鸡,像睡著了一般。 火紅的嫁衣襯著肌膚如雪段标。 梳的紋絲不亂的頭發(fā)上涯冠,一...
    開封第一講書人閱讀 51,679評論 1 305
  • 那天,我揣著相機與錄音逼庞,去河邊找鬼蛇更。 笑死,一個胖子當著我的面吹牛赛糟,可吹牛的內(nèi)容都是我干的派任。 我是一名探鬼主播,決...
    沈念sama閱讀 40,406評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼璧南,長吁一口氣:“原來是場噩夢啊……” “哼吨瞎!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起穆咐,我...
    開封第一講書人閱讀 39,311評論 0 276
  • 序言:老撾萬榮一對情侶失蹤颤诀,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后对湃,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體崖叫,經(jīng)...
    沈念sama閱讀 45,767評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年拍柒,在試婚紗的時候發(fā)現(xiàn)自己被綠了心傀。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,090評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡拆讯,死狀恐怖脂男,靈堂內(nèi)的尸體忽然破棺而出养叛,到底是詐尸還是另有隱情,我是刑警寧澤宰翅,帶...
    沈念sama閱讀 35,785評論 5 346
  • 正文 年R本政府宣布弃甥,位于F島的核電站,受9級特大地震影響汁讼,放射性物質(zhì)發(fā)生泄漏淆攻。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,420評論 3 331
  • 文/蒙蒙 一嘿架、第九天 我趴在偏房一處隱蔽的房頂上張望瓶珊。 院中可真熱鬧,春花似錦耸彪、人聲如沸伞芹。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,988評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽丑瞧。三九已至,卻和暖如春蜀肘,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背稽屏。 一陣腳步聲響...
    開封第一講書人閱讀 33,101評論 1 271
  • 我被黑心中介騙來泰國打工扮宠, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人狐榔。 一個月前我還...
    沈念sama閱讀 48,298評論 3 372
  • 正文 我出身青樓坛增,卻偏偏與公主長得像,于是被迫代替她去往敵國和親薄腻。 傳聞我的和親對象是個殘疾皇子收捣,可洞房花燭夜當晚...
    茶點故事閱讀 45,033評論 2 355

推薦閱讀更多精彩內(nèi)容