第25周-2433個(gè)乳腺癌患者的173個(gè)基因的突變?nèi)皥D

2433個(gè)乳腺癌患者的173個(gè)基因的突變?nèi)皥D

發(fā)表于2016年的NC斑鸦,The somatic mutation profiles of 2,433 breast cancers refine their genomic and transcriptomic landscapes 可以說(shuō)后續(xù)做乳腺癌人群隊(duì)列突變研究的都需要引用這篇文章的數(shù)據(jù)結(jié)果愕贡,里面涉及到的分析要點(diǎn)也比較多,都是比較容易重現(xiàn)的巷屿。

這2433個(gè)病人固以,來(lái)自于 METABRIC 計(jì)劃,已經(jīng)有

  • copy number aberration (CNA)
  • gene expression
  • long-term clinical follow-up

的信息嘱巾,所以這個(gè)時(shí)候再加入173個(gè)基因的捕獲測(cè)序憨琳,可以更加全面的了解乳腺癌患者。

乳腺癌具有患者間與同一患者腫瘤內(nèi)的基因組變異性浓冒。以患者間的異源性分類早期乳腺癌生物亞型栽渴,現(xiàn)在臨床對(duì)乳腺癌患者通常是觀察 morphological assessment (size, grade, lymph node status) 尖坤,或者檢查稳懒,ER,PR,HER2 等marker,目前的亞型主要是以下:

  • 管腔A型(luminal A)
  • 管腔B型(luminal B)
  • 類正常乳腺型(normal breast-like)
  • HER-2型
  • 基底細(xì)胞樣(basal-like)乳腺癌。

Pereiral等通過(guò)測(cè)序2433例乳腺癌樣本的173個(gè)基因场梆,發(fā)現(xiàn)40個(gè)腫瘤抑制基因和癌基因的驅(qū)動(dòng)基因(多重驅(qū)動(dòng))墅冷,這些基因參與的生物學(xué)過(guò)程包括:

  • AKT信號(hào)
  • 細(xì)胞周期調(diào)節(jié)
  • 染色質(zhì)功能
  • DNA損傷與凋亡
  • MAPK信號(hào)
  • 組織架構(gòu)
  • 轉(zhuǎn)錄調(diào)節(jié)
  • 泛素化

并且發(fā)現(xiàn)ER+乳腺癌患者PI3K突變與不同的生存相關(guān)。

實(shí)驗(yàn)前挑選基因

挑選的173個(gè)基因或油,來(lái)自于前面的TCGA計(jì)劃寞忿,下面簡(jiǎn)單列出幾個(gè)基因:

#Supplementary Dataset 1 - Details of genes & mutations in this study
#Genes names, positions and annotation transcripts, numbers of various classs of mutations, numbers of CNAs, numbers of samples with double mutations, whether gene was included because of homozygous deletions

完整表格見(jiàn): Supplementary Data 1

HGNC_symbol Chr Start End Strand Annotation_transcript Number_mutations Number_synonymous Number_missense
ACVRL1 12 52300702 52317645 + ENST00000388922 72 7 12
AFF2 X 147581639 148082693 + ENST00000370460 296 28 40
AGMO 7 15239443 15602140 - ENST00000342526 117 11 24
AGTR2 X 115301458 115306725 + ENST00000371906 40 0 14
AHNAK 11 62200516 62314832 - ENST00000378024 387 82 237
AHNAK2 14 105403091 105445194 - ENST00000333244 878 322 524
AKAP9 7 91569689 91740487 + ENST00000356239 265 30 137
AKT1 14 105235187 105262580 - ENST00000554581 193 17 96
AKT2 19 40735724 40791765 - ENST00000392038 138 10 12
ALK 2 29415140 30144932 - ENST00000389048 188 37 49
APC 5 112042702 112182436 + ENST00000457016 159 18 55
ARID1A 1 27022022 27109101 + ENST00000324856 243 39 57
ARID1B 6 157098564 157532413 + ENST00000346085 204 40 54
ARID2 12 46123120 46302319 + ENST00000334344 159 29 36
ARID5B 10 63660513 63857207 + ENST00000279873 143 18 39
ASXL1 20 30945647 31027622 + ENST00000375687 142 21 50
ASXL2 2 25961753 26101812 - ENST00000435504 128 13 42

somatic突變結(jié)果

大部分的分析資料都是在: Supplementary Information

純粹分析結(jié)果在 : Somatic mutation calls and ASCAT segment files for 2,433 primary tumours are available at http://github.com/cclab-brca

但是原始數(shù)據(jù)是 EGAS00001001753 需要申請(qǐng)才能下載。

突變?nèi)匀皇且? PIK3CA (coding mutations in 40.1% of the samples) and TP53 (35.4%) 為主顶岸。

其次就只有5個(gè)基因突變超過(guò)10%的樣本了腔彰,分別是:MUC16 (16.8%); AHNAK2 (16.2%); SYNE1 (12.0%); KMT2C (also known as MLL3; 11.4%) and GATA3 (11.1%) ,但是MUC16 本身的背景噪音太大辖佣,不適合二代測(cè)序這個(gè)技術(shù)霹抛。**

病理性的germline突變情況

還是那些出名的基因作者就拿出來(lái)說(shuō)了說(shuō):

  • BRCA1 and BRCA2 were identified in 1.36% and 1.64% of the cohort, respectively
  • 2.22% of tumours harboured pathogenic CHEK2germline mutations.
  • TP53 pathogenic germline mutations were found in 0.82% of the tumours.

突變過(guò)濾策略

值得注意的是: All reads with a mapping quality < 70 were removed prior to calling.

其它策略包括:

  • Based on our analysis of replicates, SNVs with MuTect quality scores <6.95 were removed.
  • We removed those variants that overlapped with repetitive regions
  • Fisher’s exact test was used to identify variants exhibiting read direction bias
  • SNVs present at VAFs smaller than 0.1 or at loci covered by fewer than 10 reads were removed, unless they were also present and confirmed somatic in the Catalogue of Somatic Mutations in Cancer (COSMIC).
  • 刪除那些在千人基因組計(jì)劃的任意人群(AMR, ASN, AFR) 里面頻率大于1%的變異位點(diǎn)。
  • We used the normal samples in our data set (normal pool) to control for both sequencing noise and germline variants, and removed any SNV observed in the normal pool (at a VAF of at least 0.1).

這些策略理論上是需要引入到自己的研究里面的卷谈。

找driver突變

使用的是: Vogelstein et al.16 的方法 杯拐, 定位了 40個(gè)基因 , We used a ratiometric method to identify 40 Mut-driver genes

主要是區(qū)分recurrent和inactivating的突變

其中recurrent突變包括

  • nonsynonymous SNVs
  • in-frame indels
  • oncogene score (ONC)

而inactivating突變包括:

  • frameshift indels
  • nonsense SNVs
  • splice site mutations
  • tumour suppressor gene score (TSG)

The mutation patterns of some Mut-driver genes differed by ER status.

值得注意的是:

  • Overall, 22.6% of tumours harboured a coding mutation in one of the seven Mut-driver genes involved in chromatin function (KMT2C, ARID1A, NCOR1, CTCF, KDM6A, PRBM1 and TBL1XR1).
  • Of the 40 genes, 8 were independently identified as Mut-driver tumour suppressor genes using the ratiometric method described above: FOXO3, CTNNA1, FOXP1, MEN1, CHEK2 in ER+ tumours; CDKN2A, KDM6A and MLLT4 in both ER+ and ER? tumours.

探索不同突變直接的關(guān)系世蔗,互斥或者共發(fā)生

首先是somatic的SNVs的 關(guān)系端逼,如下圖:

[圖片上傳失敗...(image-b43f90-1542717772571)]

只要有了這些突變信息,比如maf格式的somatic mutations就可以用現(xiàn)成的R包污淋,比如maftools來(lái)做上圖顶滩。

然后是somatic的CNVs的關(guān)系,如下圖

[圖片上傳失敗...(image-38a60b-1542717772571)]

這個(gè)要稍微復(fù)雜一點(diǎn)寸爆,把拷貝數(shù)變異和點(diǎn)突變信息來(lái)互相聯(lián)系诲祸。

根據(jù) IntClusts 分類來(lái)看突變情況

前面的分析,都是根據(jù)ER表達(dá)情況來(lái)對(duì)兩千多個(gè)乳腺癌患者進(jìn)行分類而昨,現(xiàn)在是通過(guò)作者前面發(fā)表的 IntClusts 分類來(lái)檢查突變情況救氯,下面的這個(gè)突變?nèi)皥D是整個(gè)文章的精髓:

image

根據(jù) mutant-allele tumour heterogeneity (MATH) 來(lái)探索腫瘤異質(zhì)性

結(jié)論很清晰:

  • ER+ tumours generally had lower MATH scores (median=0.29, IQR=0.18–0.44) than ER? tumours (median=0.41, IQR=0.25–0.56).
  • Higher MATH scores were associated with worse outcome in ER+ cancers

這個(gè)分析也是被 maftools 包裝起來(lái)了,很容易在自己的數(shù)據(jù)里面復(fù)現(xiàn)這個(gè)分析點(diǎn)歌憨。

(文章轉(zhuǎn)自jimmy的2018年閱讀文獻(xiàn)筆記)

生信基礎(chǔ)知識(shí)大全系列:生信基礎(chǔ)知識(shí)100講
史上最強(qiáng)的生信自學(xué)環(huán)境準(zhǔn)備課來(lái)啦W藕! 7次改版务嫡,11節(jié)課程甲抖,14K的講稿,30個(gè)夜晚打磨心铃,100頁(yè)P(yáng)PT的課程准谚。
如果需要組裝自己的服務(wù)器;代辦生物信息學(xué)服務(wù)器
如果需要幫忙下載海外數(shù)據(jù)(GEO/TCGA/GTEx等等)去扣,點(diǎn)我柱衔?
如果需要線下輔導(dǎo)及培訓(xùn),看招學(xué)徒
如果需要個(gè)人電腦:個(gè)人計(jì)算機(jī)推薦
如果需要置辦生物信息學(xué)書籍,看:生信人必備書單
如果需要實(shí)習(xí)崗位:實(shí)習(xí)職位發(fā)布
如果需要售后:點(diǎn)我
如果需要入門資料大全:點(diǎn)我

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末唆铐,一起剝皮案震驚了整個(gè)濱河市哲戚,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌艾岂,老刑警劉巖顺少,帶你破解...
    沈念sama閱讀 217,277評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異王浴,居然都是意外死亡脆炎,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門氓辣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)腕窥,“玉大人,你說(shuō)我怎么就攤上這事筛婉〈乇” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 163,624評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵爽撒,是天一觀的道長(zhǎng)入蛆。 經(jīng)常有香客問(wèn)我,道長(zhǎng)硕勿,這世上最難降的妖魔是什么哨毁? 我笑而不...
    開(kāi)封第一講書人閱讀 58,356評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮源武,結(jié)果婚禮上扼褪,老公的妹妹穿的比我還像新娘。我一直安慰自己粱栖,他們只是感情好话浇,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,402評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著闹究,像睡著了一般幔崖。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上渣淤,一...
    開(kāi)封第一講書人閱讀 51,292評(píng)論 1 301
  • 那天赏寇,我揣著相機(jī)與錄音,去河邊找鬼价认。 笑死嗅定,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的用踩。 我是一名探鬼主播渠退,決...
    沈念sama閱讀 40,135評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼忙迁,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了智什?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 38,992評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤丁屎,失蹤者是張志新(化名)和其女友劉穎荠锭,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體晨川,經(jīng)...
    沈念sama閱讀 45,429評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡证九,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,636評(píng)論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了共虑。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片愧怜。...
    茶點(diǎn)故事閱讀 39,785評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖妈拌,靈堂內(nèi)的尸體忽然破棺而出拥坛,到底是詐尸還是另有隱情,我是刑警寧澤尘分,帶...
    沈念sama閱讀 35,492評(píng)論 5 345
  • 正文 年R本政府宣布猜惋,位于F島的核電站,受9級(jí)特大地震影響培愁,放射性物質(zhì)發(fā)生泄漏著摔。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,092評(píng)論 3 328
  • 文/蒙蒙 一定续、第九天 我趴在偏房一處隱蔽的房頂上張望谍咆。 院中可真熱鬧,春花似錦私股、人聲如沸摹察。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,723評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)港粱。三九已至,卻和暖如春旦签,著一層夾襖步出監(jiān)牢的瞬間查坪,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,858評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工宁炫, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留偿曙,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,891評(píng)論 2 370
  • 正文 我出身青樓羔巢,卻偏偏與公主長(zhǎng)得像望忆,于是被迫代替她去往敵國(guó)和親罩阵。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,713評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 中國(guó)人群的乳腺癌研究 2018年在 Nature Communications 雜志上在線發(fā)表了題為“Charac...
    小夢(mèng)游仙境閱讀 1,530評(píng)論 0 2
  • 非常優(yōu)秀的研究總結(jié)启摄,值得學(xué)習(xí)領(lǐng)會(huì)和思考稿壁。因?yàn)樽謹(jǐn)?shù)太多,可以去作者的博文地址http://www.huangshuj...
    王詩(shī)翔閱讀 4,187評(píng)論 1 24
  • 我可以是小偷 但是我不可以教我的孩子去做小偷 因?yàn)橄M豢梢栽谖沂掷镢郎?我可以是小偷 但是我不可以讓我的孩子也是...
    思念是水我是木閱讀 253評(píng)論 0 0
  • 目前我在以結(jié)構(gòu)式兒童游戲治療的方式接兒童的個(gè)案歉备,雖然通常家長(zhǎng)將孩子送到中心傅是,很放心的將孩子交給我們,但可能家長(zhǎng)并不...
    峰至閱讀 690評(píng)論 0 4
  • “春色滿園關(guān)不住蕾羊,一枝紅杏出墻來(lái)喧笔。”盎然生機(jī)的校園里的春天就像那古壁上的題刻龟再,抹不去也拭不掉书闸,一切都來(lái)得靜悄悄...
    呂慧玟閱讀 285評(píng)論 0 0