maftools|TCGA腫瘤突變數(shù)據(jù)的匯總境析,分析和可視化

本文首發(fā)于公眾號(hào)“生信補(bǔ)給站”憔儿,https://mp.weixin.qq.com/s/WG4JHs9RSm5IEJiiGEzDkg

之前介紹了使用maftools | 從頭開(kāi)始繪制發(fā)表級(jí)oncoplot(瀑布圖) R-maftools包繪制組學(xué)突變結(jié)果(MAF)的oncoplot或者叫“瀑布圖”耀里,以及一些細(xì)節(jié)的更改和注釋咙鞍。

本文繼續(xù)介紹maftools對(duì)于MAF文件的其他應(yīng)用孵奶,為更易理解和重現(xiàn)载绿,本次使用TCGA下載的LIHC數(shù)據(jù)冀自。

一 數(shù)據(jù)部分

setwd("C:\\Users\\Maojie\\Desktop\\maftools-V2\\")
library(maftools)
laml.maf = read.csv("TCGA.LIHC.mutect.maf.csv",header=TRUE) 

#本次只展示maf的一些統(tǒng)計(jì)繪圖余境,只讀入組學(xué)數(shù)據(jù),不添加臨床數(shù)據(jù)
laml = read.maf(maf = laml.maf)
#查看數(shù)據(jù)的基本情況
laml
An object of class  MAF 
                        ID summary   Mean Median
 1:             NCBI_Build       1     NA     NA
 2:                 Center       1     NA     NA
 3:                Samples     364     NA     NA
 4:                 nGenes   12704     NA     NA
 5:        Frame_Shift_Del    1413  3.893      3
 6:        Frame_Shift_Ins     551  1.518      1
 7:           In_Frame_Del     277  0.763      0
 8:           In_Frame_Ins     112  0.309      0
 9:      Missense_Mutation   28304 77.972     63
10:      Nonsense_Mutation    1883  5.187      4
11:       Nonstop_Mutation      45  0.124      0
12:            Splice_Site    1051  2.895      2
13: Translation_Start_Site      65  0.179      0
14:                  total   33701 92.840     75

可以將MAF文件的gene 肥惭,sample的 summary 的信息牵囤,輸出到laml前綴的summary文件

write.mafSummary(maf = laml, basename = 'laml')

laml_geneSummary.txt

img

laml_sampleSummary.txt

img

二 繪圖部分

1,首先繪制MAF文件的整體結(jié)果圖

plotmafSummary(maf = laml, rmOutlier = TRUE, addStat = 'median', dashboard = TRUE, titvRaw = FALSE)
img

2,oncoplot圖

#oncoplot for top ten mutated genes.
oncoplot(maf = laml, top = 20)
img

添加SCNA信息,添加P值信息,添加臨床注釋信息,更改顏色等可參考 鏈接 。稳强。

3 Oncostrip

可以使用 oncostrip 函數(shù)展示特定基因在樣本中的突變情況褒繁,此處查看肝癌中關(guān)注較多的'TP53','CTNNB1', 'ARID1A'三個(gè)基因,如下:

oncostrip(maf = laml, genes = c('TP53','CTNNB1', 'ARID1A'))
img

4 Transition , Transversions

titv函數(shù)將SNP分類(lèi)為T(mén)ransitions_vs_Transversions偷溺,并以各種方式返回匯總表的列表尉共。匯總數(shù)據(jù)也可以顯示為一個(gè)箱線圖霹菊,顯示六種不同轉(zhuǎn)換的總體分布,并作為堆積條形圖顯示每個(gè)樣本中的轉(zhuǎn)換比例。

laml.titv = titv(maf = laml, plot = FALSE, useSyn = TRUE)
#plot titv summary
plotTiTv(res = laml.titv)
img

5 Rainfall plots

使用rainfallPlot參數(shù)繪制rainfall plots,展示超突變的基因組區(qū)域示辈。detectChangePoints設(shè)置為T(mén)RUE,rainfall plots可以突出顯示潛在變化的區(qū)域.

brca <- system.file("extdata", "brca.maf.gz", package = "maftools")
brca = read.maf(maf = brca, verbose = FALSE)
rainfallPlot(maf = laml, detectChangePoints = TRUE, pointSize = 0.6)
img

6 Compare mutation load against TCGA cohorts

通過(guò)tcgaComapre函數(shù)實(shí)現(xiàn)laml(自有群體)與TCGA中已有的33個(gè)癌種隊(duì)列的突變負(fù)載情況的比較搞乏。

#cohortName 給輸入的隊(duì)列命名
laml.mutload = tcgaCompare(maf = laml, cohortName = 'LIHC-2')
img

7 Genecloud

使用 geneCloud參數(shù)繪制基因云,每個(gè)基因的大小與它突變的樣本總數(shù)成正比蒲每。

geneCloud(input = laml, minMut = 15)
img

8 Somatic Interactions

癌癥中的許多引起疾病的基因共同發(fā)生或在其突變模式中顯示出強(qiáng)烈的排他性∶岣埽可以使用somaticInteractions函數(shù)使用配對(duì)Fisher 's精確檢驗(yàn)來(lái)分析突變基因之間的的co-occurring 或者exclusiveness飘诗。

#exclusive/co-occurance event analysis on top 10 mutated genes. 
Interact <- somaticInteractions(maf = laml, top = 25, pvalue = c(0.05, 0.1))
#提取P值結(jié)果
Interact$gene_sets
                 gene_set       pvalue
 1:   CTNNB1, AXIN1, TP53 0.0001486912
 2:  CTNNB1, TP53, ARID1A 0.0018338597
 3:     AXIN1, TP53, APOB 0.0087076043
 4:     CSMD3, AXIN1, ALB 0.0130219628
 5:      AXIN1, TP53, ALB 0.0173199619
 6: CTNNB1, AXIN1, ARID1A 0.0363739468

img

可以看到TP53和CTNNB1之間有較強(qiáng)的exclusiveness畏陕,也與文獻(xiàn)中的結(jié)論一致飒焦。

9 Comparing two cohorts (MAFs)

由于癌癥的突變模式各不相同,因此可是 mafComapre參數(shù)比較兩個(gè)不同隊(duì)列的差異突變基因洒嗤,檢驗(yàn)方式為fisher檢驗(yàn)。

#輸入另一個(gè) MAF 文件
Our_maf <- read.csv("Our_maf.csv",header=TRUE)
our_maf = read.maf(maf = Our_maf)

#Considering only genes which are mutated in at-least in 5 samples in one of the cohort to avoid bias due to genes mutated in single sample.
pt.vs.rt <- mafCompare(m1 = laml, m2 = our_maf, m1Name = 'LIHC', m2Name = 'OUR', minMut = 5)
print(pt.vs.rt)
img
  • result部分會(huì)有每個(gè)基因分別在兩個(gè)隊(duì)列中的個(gè)數(shù)以及P值和置信區(qū)間等信息良姆。
  • SampleSummary 會(huì)有兩個(gè)隊(duì)列的樣本數(shù)陆馁。
1) Forest plots

比較結(jié)果繪制森林圖

forestPlot(mafCompareRes = pt.vs.rt, pVal = 0.01, color = c('royalblue', 'maroon'), geneFontSize = 0.8)
img

10 Oncogenic 信號(hào)通路

``OncogenicPathways` 功能查看顯著富集通路

OncogenicPathways(maf = laml)
#會(huì)輸出統(tǒng)計(jì)結(jié)果
Pathway alteration fractions
       Pathway  N n_affected_genes fraction_affected
 1:    RTK-RAS 85               68         0.8000000
 2:        WNT 68               55         0.8088235
 3:      NOTCH 71               52         0.7323944
 4:      Hippo 38               30         0.7894737
 5:       PI3K 29               24         0.8275862


img

可以對(duì)上面富集的通路中選擇感興趣的進(jìn)行完成的突變展示:

PlotOncogenicPathways(maf = laml, pathways = "PI3K")
img

好了,以上就是使用maftools包對(duì)MAF格式的組學(xué)數(shù)據(jù)的匯總琐旁,分析辣之,可視化灾部。

后臺(tái)回復(fù)“maf文件”即可獲得示例的maf文件和代碼

img

【覺(jué)得不錯(cuò),右下角點(diǎn)擊賞個(gè)“在看”,轉(zhuǎn)發(fā)就是贊賞框沟,謝謝队丝!】

img
微信圖片.jpg
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末码党,一起剝皮案震驚了整個(gè)濱河市箕慧,隨后出現(xiàn)的幾起案子昧绣,更是在濱河造成了極大的恐慌箫攀,老刑警劉巖识椰,帶你破解...
    沈念sama閱讀 218,941評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件景殷,死亡現(xiàn)場(chǎng)離奇詭異踏兜,居然都是意外死亡纳本,警方通過(guò)查閱死者的電腦和手機(jī)巾腕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)冀泻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)腔长,“玉大人鸟召,你說(shuō)我怎么就攤上這事跟继『滴铮” “怎么了虎忌?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,345評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵泡徙,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我膜蠢,道長(zhǎng)堪藐,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,851評(píng)論 1 295
  • 正文 為了忘掉前任挑围,我火速辦了婚禮礁竞,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘杉辙。我一直安慰自己模捂,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著狂男,像睡著了一般综看。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上岖食,一...
    開(kāi)封第一講書(shū)人閱讀 51,688評(píng)論 1 305
  • 那天红碑,我揣著相機(jī)與錄音,去河邊找鬼泡垃。 笑死析珊,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的蔑穴。 我是一名探鬼主播唾琼,決...
    沈念sama閱讀 40,414評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼澎剥!你這毒婦竟也來(lái)了锡溯?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,319評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤哑姚,失蹤者是張志新(化名)和其女友劉穎祭饭,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體叙量,經(jīng)...
    沈念sama閱讀 45,775評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡倡蝙,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了绞佩。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片寺鸥。...
    茶點(diǎn)故事閱讀 40,096評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖品山,靈堂內(nèi)的尸體忽然破棺而出胆建,到底是詐尸還是另有隱情,我是刑警寧澤肘交,帶...
    沈念sama閱讀 35,789評(píng)論 5 346
  • 正文 年R本政府宣布笆载,位于F島的核電站,受9級(jí)特大地震影響涯呻,放射性物質(zhì)發(fā)生泄漏凉驻。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評(píng)論 3 331
  • 文/蒙蒙 一复罐、第九天 我趴在偏房一處隱蔽的房頂上張望涝登。 院中可真熱鬧,春花似錦效诅、人聲如沸胀滚。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,993評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)蛛淋。三九已至咙好,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間褐荷,已是汗流浹背勾效。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,107評(píng)論 1 271
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留叛甫,地道東北人层宫。 一個(gè)月前我還...
    沈念sama閱讀 48,308評(píng)論 3 372
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像其监,于是被迫代替她去往敵國(guó)和親萌腿。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • superqun 原創(chuàng)于簡(jiǎn)書(shū) 手工目錄: Q1:如何在肺癌數(shù)據(jù)庫(kù)中選出k-ras突變的病人樣本抖苦。 1. 使用GDC...
    superqun閱讀 12,261評(píng)論 1 43
  • 得益于曾老師的介紹引導(dǎo)毁菱,了解此包。了解一個(gè)包锌历,先看包的說(shuō)明書(shū)贮庞,包的用法都在里面。maftools包說(shuō)明書(shū) 1.安裝...
    Dr_grass閱讀 21,462評(píng)論 7 39
  • 我想了很多的究西,其實(shí) 我是一個(gè)喜歡極限運(yùn)動(dòng)的人 跳傘 蹦極…也許他會(huì)陪不了我窗慎。 我就是一個(gè)愛(ài)鬧的小瘋子,但是偶爾也需...
  • 快的軟件上最多的還是顯示從永樂(lè)街33號(hào)啟程的記錄卤材。連續(xù)大半個(gè)月的熬夜加班終于見(jiàn)到了暫時(shí)停止的眉目遮斥。 人生真的很奇妙...
    上校Andrew閱讀 214評(píng)論 0 0
  • 小的時(shí)候過(guò)中秋節(jié),爸爸總是買(mǎi)一斤月餅扇丛,一斤五塊术吗,五仁的,用一個(gè)有一點(diǎn)兒油花花的薄塑料袋裝著晕拆。 只有五塊藐翎。不是不想多...
    懷雙閱讀 817評(píng)論 4 9