SCENIC是干啥的玄妈?

SCENIC是干啥的侦镇?

【輸入】motif數(shù)據(jù)庫(kù)灵疮、單細(xì)胞RNA-seq數(shù)據(jù)

【輸出】regulons、每個(gè)細(xì)胞的regulon activity scores (RAS)

【意義】構(gòu)建轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)壳繁、鑒定cell-state震捣,幫你挖轉(zhuǎn)錄調(diào)控機(jī)制荔棉。

啥樣的文章用到SCENIC?

引用SCENIC文章的要么是頂級(jí)生信綜述蒿赢,要么是CNS润樱。

應(yīng)用領(lǐng)域廣泛,從人到小鼠羡棵、果蠅壹若,從腫瘤、心血管疾病皂冰、肺纖維化到新冠病毒店展。

圖片

SCENIC怎樣用到文章里?

我們來(lái)看FigureYa194pySCENIC所復(fù)現(xiàn)的例文的研究思路秃流。文章一共四個(gè)Figure赂蕴,前三個(gè)都用到了SCENIC。

圖片

第一步剔应,找到regulon

  • 通過(guò)基因共表達(dá)分析,建立可能的TF-target調(diào)控關(guān)系语御;

  • 通過(guò)motif分析峻贮,建立TF-target的直接調(diào)控關(guān)系。

  • 這樣對(duì)每個(gè)TF应闯,我們可能會(huì)找到若干個(gè)直接下游纤控,這些基因我們將之命名為regulon

  • 對(duì)每個(gè)細(xì)胞計(jì)算regulon activity score (RAS)碉纺;

  • 再用RAS對(duì)細(xì)胞降維船万,畫(huà)出Figure 1。

圖片

Figure 1. Mapping Mouse Cell Network Atlas with Regulon Activity

第二步骨田,找到細(xì)胞類(lèi)型特異的regulon

計(jì)算RSS(Regulon specific score) matrix耿导,尋找特定細(xì)胞特異的regulon,并利用SEEK進(jìn)行驗(yàn)證态贤。繪制文章的Figure2舱呻。

圖片

Figure 2. Cell-Type-Specific Regulon Activity Analysis

第三步,找regulon Modules和Cell type的對(duì)應(yīng)關(guān)系

計(jì)算CSI(Connection Specificity Index) matrix悠汽,基于CSI對(duì)regulon進(jìn)行層次聚類(lèi)箱吕,繪制Figure3的Heatmap。從JASPAR數(shù)據(jù)庫(kù)下載給定轉(zhuǎn)錄因子的motif矩陣柿冲,繪制Figure3的motif logo茬高。

圖片

Figure 3. Identification of Combinatorial Regulon Modules

FigureYa194pySCENIC帶你復(fù)現(xiàn)****文章的KEY Figure——Figure 2,順便畫(huà)出Figure 1和Figure 3假抄。

怎樣實(shí)現(xiàn)以上研究?jī)?nèi)容怎栽?

看Jarning詳細(xì)解析文章的method:

用的是已發(fā)表的數(shù)據(jù)

2018年郭國(guó)冀團(tuán)隊(duì)利用其自主的高通量單細(xì)胞轉(zhuǎn)錄組技術(shù)Microwell-seq對(duì)小鼠全身的組織進(jìn)行了單細(xì)胞轉(zhuǎn)錄組測(cè)序丽猬。這組數(shù)據(jù)標(biāo)記清晰,有兩個(gè)數(shù)據(jù)集:subsampled ~61K cells和whole MCA ~250K cells婚瓜。本文用的是前者宝鼓。

用SCENIC推測(cè)regulons及其activity

作者沒(méi)有直接用SCENIC進(jìn)行分析。而是在分析前對(duì)數(shù)據(jù)做了一個(gè)pooling巴刻,即:將同一個(gè)cluster的細(xì)胞每20個(gè)pooling到一塊(無(wú)放回抽樣)愚铡,得到一個(gè)新的轉(zhuǎn)錄組,作者稱(chēng)為Avg20胡陪。作者的考慮如下:

  1. SCENIC對(duì)細(xì)胞數(shù)量的擴(kuò)展性不夠好沥寥。(太多細(xì)胞會(huì)降低SCENIC的性能)

  2. 測(cè)序深度不夠會(huì)影響SCENIC的結(jié)果。(Micorwell-seq的測(cè)序深度相對(duì)于其它技術(shù)較淺)

作者隨后在figure S1中說(shuō)明了Avg20的對(duì)聚類(lèi)效果的提升以及對(duì)regulon的穩(wěn)定性的影響柠座。

圖片

作者主要選擇了三個(gè)指標(biāo)進(jìn)行性能比較:

  1. Silhouette Value(boxplot + t test)

  2. TF-Regulon的一致性(Venn plot + fisher exact test)

  3. 不同replicates之間RAS(Regulon Activity Scores)的相關(guān)性

【注1】Silhouette Value:輪廓系數(shù)邑雅。見(jiàn):https://blog.csdn.net/wangxiaopeng0329/article/details/53542606

【注2】Regulon Activity Scores:來(lái)自于SCENIC的結(jié)果。用來(lái)描述一個(gè)TF + Regulon在細(xì)胞中的轉(zhuǎn)錄活性妈经。

計(jì)算cell-type specificity score

在通過(guò)SCENIC分析得到了regulon的結(jié)果后淮野,作者定義了RSS(Regulon Specificity Score)來(lái)尋找細(xì)胞類(lèi)型特異的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)。

圖片

換個(gè)方法驗(yàn)證

作者對(duì)找到的cell specific regulon利用其它的方法進(jìn)行了驗(yàn)證吹泡。

(1)SEEK analysis骤星,2000+ GEO datasets. 檢驗(yàn)

a)regulon genes是否是共表達(dá)的

b)regulon基因是否和給定細(xì)胞類(lèi)型有相關(guān)性

(2)CoCiter analysis,文獻(xiàn)挖掘爆哑,檢驗(yàn)一組基因是否和某個(gè)term(本文使用的是細(xì)胞類(lèi)型)有相關(guān)性洞难。

分析Regulon module

作者在這里分析了regulon之間的關(guān)系。首先顯而易見(jiàn)的方法是通過(guò)RAS來(lái)計(jì)算不同regulon之間的相關(guān)性系數(shù)(PCC, Pearson Correlation Coefficient)揭朝。

作者基于PCC队贱,計(jì)算了CSI(Connection Specificity Index)來(lái)衡量regulon pairs之間的相關(guān)性。

regulon A和regulon B的CSI定義為所有和A潭袱,B相關(guān)的regulons pairs中柱嫌,PCC小于PCC(A,B)的比例。顯而易見(jiàn)屯换,CSI越大慎式,那么regulon A和regulon B的相關(guān)性越大。

CSI的好處是可以不受到極端值的影響趟径。regulon A和regulon B的CSI的計(jì)算如下

圖片

這樣我們就得到了CSI matrix瘪吏。接下來(lái)作者對(duì)CSI matrix進(jìn)行層次聚類(lèi),畫(huà)出Figure 3蜗巧。

CSI > 0.7對(duì)CSI matrix進(jìn)行二值化掌眠,在此基礎(chǔ)上構(gòu)建相關(guān)性網(wǎng)絡(luò),即Figure 4幕屹。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末蓝丙,一起剝皮案震驚了整個(gè)濱河市级遭,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌渺尘,老刑警劉巖挫鸽,帶你破解...
    沈念sama閱讀 221,888評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異鸥跟,居然都是意外死亡丢郊,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,677評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén)医咨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)枫匾,“玉大人,你說(shuō)我怎么就攤上這事拟淮「绍裕” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,386評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵很泊,是天一觀的道長(zhǎng)角虫。 經(jīng)常有香客問(wèn)我,道長(zhǎng)委造,這世上最難降的妖魔是什么戳鹅? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,726評(píng)論 1 297
  • 正文 為了忘掉前任,我火速辦了婚禮争涌,結(jié)果婚禮上粉楚,老公的妹妹穿的比我還像新娘辣恋。我一直安慰自己亮垫,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,729評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布伟骨。 她就那樣靜靜地躺著饮潦,像睡著了一般。 火紅的嫁衣襯著肌膚如雪携狭。 梳的紋絲不亂的頭發(fā)上继蜡,一...
    開(kāi)封第一講書(shū)人閱讀 52,337評(píng)論 1 310
  • 那天,我揣著相機(jī)與錄音逛腿,去河邊找鬼稀并。 笑死,一個(gè)胖子當(dāng)著我的面吹牛单默,可吹牛的內(nèi)容都是我干的碘举。 我是一名探鬼主播,決...
    沈念sama閱讀 40,902評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼搁廓,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼引颈!你這毒婦竟也來(lái)了耕皮?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,807評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤蝙场,失蹤者是張志新(化名)和其女友劉穎凌停,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體售滤,經(jīng)...
    沈念sama閱讀 46,349評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡罚拟,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,439評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了趴泌。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片舟舒。...
    茶點(diǎn)故事閱讀 40,567評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖嗜憔,靈堂內(nèi)的尸體忽然破棺而出秃励,到底是詐尸還是另有隱情,我是刑警寧澤吉捶,帶...
    沈念sama閱讀 36,242評(píng)論 5 350
  • 正文 年R本政府宣布夺鲜,位于F島的核電站,受9級(jí)特大地震影響呐舔,放射性物質(zhì)發(fā)生泄漏币励。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,933評(píng)論 3 334
  • 文/蒙蒙 一珊拼、第九天 我趴在偏房一處隱蔽的房頂上張望食呻。 院中可真熱鬧,春花似錦澎现、人聲如沸仅胞。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,420評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)干旧。三九已至,卻和暖如春妹蔽,著一層夾襖步出監(jiān)牢的瞬間椎眯,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,531評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工胳岂, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留编整,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,995評(píng)論 3 377
  • 正文 我出身青樓乳丰,卻偏偏與公主長(zhǎng)得像掌测,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子成艘,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,585評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容