Rcis Target：基因集找其調(diào)控因子和motif

寫(xiě)在前面：今天學(xué)習(xí)了Rcis Target這個(gè)包闷哆，每一次在學(xué)習(xí)一個(gè)包之前噪生，苦惱和痛苦是不知道這個(gè)R包用來(lái)do for what苹享？why to do院领？今天看了http://www.reibang.com/p/6e1d71db4220周老師的簡(jiǎn)書(shū)弛矛，感覺(jué)講的就是我自己，下面我將用我的生物學(xué)知識(shí)來(lái)講關(guān)于Rcis Target的理解比然，假如有錯(cuò)的地方歡迎大家指正與批評(píng)Ｍ羲摺！谈秫！

前言：我們?cè)趩渭?xì)胞分析的時(shí)候，通過(guò)差異基因來(lái)判斷哪些clusters是什么類(lèi)型的細(xì)胞鱼鼓，所以每一種細(xì)胞類(lèi)型是一些基因（即基因集）選擇表達(dá)的結(jié)果拟烫，而基因的表達(dá)是受轉(zhuǎn)錄調(diào)控的（分子生物學(xué)知識(shí)），單從轉(zhuǎn)錄因子（TF）這一個(gè)方面來(lái)說(shuō)迄本，不同的轉(zhuǎn)錄因子調(diào)控不同的基因硕淑，進(jìn)而使細(xì)胞表現(xiàn)出不同的狀態(tài)或類(lèi)型。當(dāng)然轉(zhuǎn)錄調(diào)控不只有TF調(diào)控還有很多其他的如：順式作用元件嘉赎。

1.do for what：用B細(xì)胞為例置媳，我們可以對(duì)B細(xì)胞中高度相關(guān)的基因集（即：讓這些細(xì)胞為B細(xì)胞的基因）進(jìn)行Rcis Target分析，就可以知道哪一些TF在B細(xì)胞是富集或特有的公条，籠統(tǒng)的說(shuō)Rcis Target分析就是用來(lái)預(yù)測(cè)基因集的轉(zhuǎn)錄因子拇囊。（還可以這樣運(yùn)用，即：當(dāng)發(fā)現(xiàn)tumor中的T細(xì)胞數(shù)比normal中的T細(xì)胞數(shù)明顯多靶橱，我們可以將tumor的T細(xì)胞與normal的T細(xì)胞進(jìn)行比較寥袭，通過(guò)篩選過(guò)濾找出二者具有統(tǒng)計(jì)學(xué)差異的基因集，進(jìn)行Rcis Target分析关霸，就可以看出是什么TF導(dǎo)致了tumor和normal中T細(xì)胞的差異）

需要三個(gè)文件传黄，基因集，Gene-motif rankings::提供每個(gè)motif的所有基因的排名(~得分)队寇，轉(zhuǎn)錄因子的motif注釋

2.流程
2.1.得到genelist

library(RcisTarget)
library(Seurat)
library(SeuratData)
library(tidyverse)
#導(dǎo)入seruat對(duì)象
scRNA <- readRDS("scRNAsub.rds")   

#獲取genelist
Idents(scRNA_harmony) <- "celltype"
geneLists <- FindAllMarkers(scRNA)  

#篩選有意義的genelist
genelists <- geneLists %>% filter(cluster == 'endothelial-cells') %>% top_n(35,avg_log2FC)
head(geneLists) 
genelists <- genelists$gene  #這里也可以像周老師一樣弄成一個(gè)list

2.2使用RcisTarget內(nèi)置的轉(zhuǎn)錄因子的motif注釋數(shù)據(jù)

#這里有兩個(gè)motif注釋數(shù)據(jù)可以選  根據(jù)自己分析對(duì)象進(jìn)行選擇
# mouse:
# data(motifAnnotations_mgi)
# human:
data(motifAnnotations_hgnc)  #選擇人的

2.3導(dǎo)入Gene-motif rankings:提供每個(gè)motif的所有基因的排名(~得分)

#這個(gè)數(shù)據(jù)是比較難的膘掰，這個(gè)數(shù)據(jù)要從一個(gè)數(shù)據(jù)庫(kù)上下載，
#很大佳遣，每一個(gè)文件大概1G识埋，經(jīng)常會(huì)下載不完整凡伊，會(huì)導(dǎo)致讀入不行，會(huì)報(bào)錯(cuò)
#方法一惭聂，用R直接下載并讀取
featherURL <- "https://resources.aertslab.org/cistarget/databases/homo_sapiens/hg19/refseq_r45/mc9nr/gene_based/hg19-tss-centered-10kb-7species.mc9nr.feather" 
download.file(featherURL, destfile=basename(featherURL)) #這樣就會(huì)直接下載到當(dāng)前工作目錄下
#讀入
motifRankings <- importRankings("hg19-tss-centered-10kb-7species.mc9nr.feather")      #這里假如數(shù)據(jù)下載不全讀取R會(huì)奔潰并restart窗声，不是電腦的配置問(wèn)題

#方法二，讀取我自己提前下好的數(shù)據(jù)辜纲，
motifRankings <- importRankings("cisTarget_databases/hg38__refseq-r80__10kb_up_and_down_tss.mc9nr.feather")  #我的數(shù)據(jù)存放在cisTarget_databases文件夾下笨觅，跟網(wǎng)上下載有啥不同呢   hg19與hg38就是數(shù)據(jù)的版本不同，10kb與500bp就是想要研究基因上下調(diào)控的范圍   10kb更大  所以讀入hg19或hg38都可以耕腾。

假如大家想要我的參考數(shù)據(jù)可以私信我

77ba7845a6394c1905d538fd49efc24.png

這樣3個(gè)讀入的文件已經(jīng)搞定了
2.4開(kāi)始分析
可以直接使用cisTarget進(jìn)行一步法分析见剩，cisTarget()運(yùn)行按順序執(zhí)行的步驟
(1)motif 富集分析,
(2)motif-TF注釋,和
(3)選擇的重要基因。

motifEnrichmentTable_wGenes <- cisTarget(genelists, 
         motifRankings,
         motifAnnot=motifAnnotations_hgnc)#一步搞定分析

2.5,分析結(jié)果解讀

2f1b03028e2867ffc78df27141f2bfe.png

RcisTarget輸出：
RcisTarget的最終輸出的data.table（motifEnrichmentTable_wGenes）包含有關(guān)motif 富集的以下信息：
geneSet：基因集的名稱(chēng)
motif：motif的ID
NES：基因集中基序的標(biāo)準(zhǔn)化富集得分
AUC：曲線下的面積（用于計(jì)算NES）
TFinDB：指示突出顯示的TF是包含在高置信度注釋?zhuān)▋蓚€(gè)星號(hào)）還是低置信度注釋?zhuān)ㄒ粋€(gè)星號(hào)）中。
TF_highConf：根據(jù)'motifAnnot_highConfCat'注釋到基序的轉(zhuǎn)錄因子剧罩。這個(gè)是最主要的就可以從這里看出輸入的基因集富集到了哪一些轉(zhuǎn)錄因子盏筐，從結(jié)果中也可以看出一個(gè)TF可以與多個(gè)motif結(jié)合調(diào)節(jié)不同的基因。
TF_lowConf：根據(jù)'motifAnnot_lowConfCat'注釋到主題的轉(zhuǎn)錄因子羹呵。
erichedGenes：在給定motif上排名較高的基因。
nErnGenes：高度排名的基因數(shù)量
rankAtMax：在最大富集時(shí)的排名疗琉，用于確定富集的基因數(shù)冈欢。

2.6結(jié)果plot：plot前幾個(gè)富集到的motif和轉(zhuǎn)錄因子，蠻雞肋的

motifEnrichmentTable_wGenes_wLogo <- addLogo(motifEnrichmentTable_wGenes)

resultsSubset <- motifEnrichmentTable_wGenes_wLogo[1:10,]    #

library(DT)
datatable(resultsSubset[,-c("enrichedGenes", "TF_lowConf"), with=FALSE], 
          escape = FALSE, # To show the logo
          filter="top", options=list(pageLength=5))

c8b0b321823427c833f6fbe27afa0fa.png

關(guān)于motif的logo如何看：https://zhuanlan.zhihu.com/p/428416814

顯然一步分析法很難得到我們想要的結(jié)果盈简，我們也可以將這些步驟作為單獨(dú)的命令分別運(yùn)行凑耻。對(duì)感興趣的一個(gè)輸出進(jìn)行分析，所以建議分步法分析柠贤。

3.分步法分析
3.1 motif 富集分析（就是計(jì)算輸入的基因集富集到哪些motif香浩，并對(duì)富集的motif進(jìn)行打分）

# 1. Calculate AUC
motifs_AUC <- calcAUC(genelists, motifRankings)

3.2 motif-TF注釋 對(duì)富集到的motif進(jìn)行篩選，默認(rèn)篩選分?jǐn)?shù)為3的motifs臼勉，進(jìn)行TF富集邻吭。

# 2. Select significant motifs, add TF annotation & format as table
motifEnrichmentTable <- addMotifAnnotation(motifs_AUC,
                                           nesThreshold=3,
                                           motifAnnot=motifAnnotations_hgnc)

3.3 找出每個(gè)基序富集的基因 由于一種motif可能調(diào)控多個(gè)基因，看看每一個(gè)motif調(diào)控哪一些基因坚俗，那么就可以知道TF調(diào)控那些基因了镜盯，這就是說(shuō)Rcis Target的分析是基于motif的

## 3. Identify significant genes for each motif
# (i.e. genes from the gene set in the top of the ranking)
# Note: Method 'iCisTarget' instead of 'aprox' is more accurate, but slower
motifEnrichmentTable_wGenes <- addSignificantGenes(motifEnrichmentTable, 
                                                   geneSets=genelists,
                                                   rankings=motifRankings, 
                                                   nCores=1,
                                                   method="aprox")

3.4 利用分步文件構(gòu)建網(wǎng)絡(luò)圖（基因和motif）

signifMotifNames <- motifEnrichmentTable$motif[1:3]

incidenceMatrix <- getSignificantGenes(genelists, 
                                       motifRankings,
                                       signifRankingNames=signifMotifNames,
                                       plotCurve=TRUE, maxRank=5000, 
                                       genesFormat="incidMatrix",
                                       method="aprox")$incidMatrix

library(reshape2)
edges <- melt(incidenceMatrix)
edges <- edges[which(edges[,3]==1),1:2]
colnames(edges) <- c("from","to")
library(visNetwork)
motifs <- unique(as.character(edges[,1]))
genes <- unique(as.character(edges[,2]))
nodes <- data.frame(id=c(motifs, genes),   
                    label=c(motifs, genes),    
                    title=c(motifs, genes), # tooltip 
                    shape=c(rep("diamond", length(motifs)), rep("elypse", length(genes))),
                    color=c(rep("purple", length(motifs)), rep("skyblue", length(genes))))
visNetwork(nodes, edges) %>% visOptions(highlightNearest = TRUE, 
                                        nodesIdSelection = TRUE)  #這種網(wǎng)絡(luò)圖都是自定義的，也可以畫(huà)TF與其互作基因的網(wǎng)絡(luò)圖

建議大家可以看看周老師的簡(jiǎn)書(shū)：
http://www.reibang.com/u/06ae70ef31bc

4.References:
https://cloud.tencent.com/developer/article/1734803
http://www.reibang.com/p/6e1d71db4220
http://www.reibang.com/p/fd82f17db2d8

最后編輯于：2022.04.13 14:09:15

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末猖败，一起剝皮案震驚了整個(gè)濱河市速缆，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌恩闻，老刑警劉巖艺糜，帶你破解...
沈念sama閱讀 206,723評(píng)論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡破停，警方通過(guò)查閱死者的電腦和手機(jī)翅楼，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,485評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)真慢，“玉大人毅臊，你說(shuō)我怎么就攤上這事『诮纾” “怎么了管嬉？”我有些...
開(kāi)封第一講書(shū)人閱讀 152,998評(píng)論 0贊 344
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)朗鸠。經(jīng)常有香客問(wèn)我蚯撩，道長(zhǎng)，這世上最難降的妖魔是什么烛占？我笑而不...
開(kāi)封第一講書(shū)人閱讀 55,323評(píng)論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任胎挎，我火速辦了婚禮，結(jié)果婚禮上忆家，老公的妹妹穿的比我還像新娘犹菇。我一直安慰自己，他們只是感情好芽卿，可當(dāng)我...
茶點(diǎn)故事閱讀 64,355評(píng)論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布项栏。她就那樣靜靜地躺著，像睡著了一般蹬竖。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上流酬，一...
開(kāi)封第一講書(shū)人閱讀 49,079評(píng)論 1贊 285
城市分裂傳說(shuō)
那天币厕，我揣著相機(jī)與錄音，去河邊找鬼芽腾。笑死旦装，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的摊滔。我是一名探鬼主播阴绢，決...
沈念sama閱讀 38,389評(píng)論 3贊 400
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼艰躺！你這毒婦竟也來(lái)了呻袭？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 37,019評(píng)論 0贊 259
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤腺兴，失蹤者是張志新（化名）和其女友劉穎左电，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 43,519評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡篓足，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,971評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年段誊，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片栈拖。...
茶點(diǎn)故事閱讀 38,100評(píng)論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡连舍，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出涩哟，到底是詐尸還是另有隱情索赏，我是刑警寧澤，帶...
沈念sama閱讀 33,738評(píng)論 4贊 324
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布染簇，位于F島的核電站参滴，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏锻弓。R本人自食惡果不足惜砾赔，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,293評(píng)論 3贊 307
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望青灼。院中可真熱鬧暴心，春花似錦、人聲如沸杂拨。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,289評(píng)論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)弹沽。三九已至檀夹，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間策橘，已是汗流浹背炸渡。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 31,517評(píng)論 1贊 262
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留丽已，地道東北人蚌堵。一個(gè)月前我還...
沈念sama閱讀 45,547評(píng)論 2贊 354
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像沛婴，于是被迫代替她去往敵國(guó)和親吼畏。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,834評(píng)論 2贊 345

Rcis Target：基因集找其調(diào)控因子和motif

推薦閱讀更多精彩內(nèi)容