cBioPortal數(shù)據(jù)庫是一個包含TCGA和ICGC等大型的腫瘤研究項(xiàng)目校坑,并整合癌癥基因數(shù)據(jù)和臨床數(shù)據(jù)的國際公共數(shù)據(jù)庫,其整合的基因組數(shù)據(jù)類型包括體細(xì)胞突變函匕、DNA 拷貝數(shù)改變 (CNA)娱据、mRNA 和 microRNA (miRNA) 表達(dá)、DNA 甲基化浦箱、蛋白質(zhì)豐度和磷蛋白豐度吸耿。cBioPortal可以進(jìn)行多種分析,但最主要的還是與突變相關(guān)的各種分析及其可視化酷窥,其不僅支持單基因單癌癥的查詢咽安,而且可以進(jìn)行多基因單癌癥、單基因多癌癥蓬推、多基因多癌癥妆棒,甚至是跨癌癥基因組項(xiàng)目的分析。此外沸伏,cBioPortal數(shù)據(jù)庫還支持生物通路探索糕珊、生存分析、基因組改變之間的互斥性分析毅糟、選擇性數(shù)據(jù)下載红选、程序化訪問和出版質(zhì)量摘要可視化。
網(wǎng)址:https://www.cbioportal.org
注意:cBioPortal已包裝到R包里姆另,對應(yīng)"cgdsr"包
Step1: 頁面介紹(選擇癌種)
1)在最左邊選擇想要組織(eg. Lung)喇肋;
2)在中間框選擇具體的研究(eg. "Lung Adenocarcinoma (TCGA, PanCancer Atlas)");
3)點(diǎn)擊下方"Query By Gene"迹辐。
Step2: 選擇需要分析的數(shù)據(jù)類型蝶防,樣本及基因等
1)選擇需要分析的數(shù)據(jù)類型;
2)選擇樣本明吩;
3)在“Enter Genes”里面輸入感興趣的基因(若網(wǎng)站報(bào)了錯“Invalid gene symbols”间学,應(yīng)注意,基因是否有別名)
4)最后,點(diǎn)擊“Submit Query”即可開始分析
Step3: 結(jié)果展示
cBioPortal包含了多組學(xué)研究中能夠?qū)崿F(xiàn)的所有分析功能低葫,包括OncoPrint(基因突變圖譜)详羡、Cancer Types Summary(泛癌種基因突變匯總)、Plots(分析拷貝數(shù)變異與基因突變或者基因表達(dá)的相關(guān)性)氮采、Mutations(基因突變列表殷绍、功能及蛋白3D結(jié)構(gòu))、Co-expression(基因共表達(dá)分析)鹊漠、Enrichments(基因突變互作/互斥分析)、Survival(生存分析)茶行、CN Segments(拷貝數(shù)分析)躯概、Network(共表達(dá)網(wǎng)絡(luò))等多種分析結(jié)果。點(diǎn)擊不同的模塊畔师,即可查看各種分析的結(jié)果娶靡,并且還能根據(jù)需要進(jìn)行一定程度的個性化調(diào)整。
3.1:
★ 以熱圖的形式展現(xiàn)樣本中mutations和CNAs的分布情況
★ 自定義可視化結(jié)果看锉,可進(jìn)行縮小放大姿锭,取消勾選view下"show unaltered cases"移除無改變cases,取消勾選view下"show whitespace between columns"移除samples之間空白伯铣,再通過Sort更改結(jié)果排序呻此。
3.2:
?
?
★ 以堆積柱狀圖的形式,展示mutations和CNAs的構(gòu)成
3.3:
?
★ 將一個基因上存在變異的樣本個數(shù)作為一個集合腔寡,通過對兩個基因?qū)?yīng)的集合進(jìn)行分析焚鲜,來分析兩個基因在腫瘤中的是互斥還是共發(fā)生,提供p值及校正后p值(q值)放前,可下載或復(fù)制表格忿磅。
3.4:
★ Plot提供可視化結(jié)果,可選擇不同數(shù)據(jù)類型凭语,選擇目標(biāo)基因葱她,左邊欄可設(shè)置橫、縱坐標(biāo)軸參數(shù)似扔,分析拷貝數(shù)變異吨些、基因突變、基因表達(dá)之間的的相關(guān)性
★ ShallowDel 虫几,Gain 和Diploid 都是對拷貝數(shù)變異(CNA)的描述:
?????? 1) 人是二倍體锤灿,Diploid 就是二倍體的意思,就是這個位置沒有拷貝數(shù)變異辆脸。
?????? 2) ShallowDel : 指拷貝數(shù)的輕度丟失但校,是shallow 和deletion 的組合,你可以理解為本來是二倍體的變成一倍體了(一般以log2Ratio的值去界定的)啡氢。
?????? 3) Gain: 輕度的拷貝數(shù)擴(kuò)增状囱,你可以理解為本來是二倍體的變成三倍體了术裸。
分析拷貝數(shù)變異與基因突變或者基因表達(dá)的相關(guān)性
3.5:
★ 展示目標(biāo)基因?qū)?yīng)蛋白質(zhì)的二維結(jié)構(gòu)圖,提供各個基因突變位點(diǎn)和頻率信息亭枷,右側(cè)欄顯示Refseq袭艺、Ensembl、CCDS和Uniprot數(shù)據(jù)庫鏈接
★ 左側(cè)叨粘,Add annotation tracks可自定義表格猾编,顯示腫瘤相關(guān)熱門位點(diǎn)(Cancer Hotspots)和蛋白翻譯后修飾位點(diǎn)(PTM sites)信息
★ 右側(cè),3D Structure可查看蛋白三維結(jié)構(gòu)圖升敲,PDB Chains可選擇想要查看的肽鏈三維結(jié)構(gòu)和具體信息
★ 下方答倡,表格顯示所有非同義突變詳細(xì)信息,Columns菜單提供以下信息:樣本ID鏈接驴党,氨基酸變化瘪撇,突變類型(錯義突變,無義突變港庄,剪接位點(diǎn)倔既,移碼,插入或缺失等)鹏氧;預(yù)測的錯義突變功能渤涌;鏈接到突出顯示突變的3D結(jié)構(gòu);突變狀態(tài)度帮;驗(yàn)證狀態(tài)歼捏;腫瘤等位基因突變頻率;匹配正常樣本等位基因突變頻率笨篷;確切基因組位置信息(染色體瞳秽,起始和終止位點(diǎn)等);受影響的同工型信息等率翅,可以根據(jù)需要進(jìn)行排序和過濾练俐。
3.6:
★ 提供該腫瘤數(shù)據(jù)集中目標(biāo)基因與其他基因共表達(dá)情況,上方欄選擇目標(biāo)基因冕臭,下方列表可選擇其他基因腺晾,右側(cè)顯示相關(guān)性點(diǎn)圖及統(tǒng)計(jì)分析結(jié)果
3.7:
★ 結(jié)合臨床信息和多組學(xué)數(shù)據(jù),根據(jù)目標(biāo)基因或有無基因組改變將樣本進(jìn)行分組比較并根據(jù)功能不同進(jìn)行不同的分析辜贵。
★ Overlop查看分組信息悯蝉;
?????? 1) Altered group為至少一個基因變化的樣本數(shù)
?????? 2) Unaltered group為未發(fā)生變化的樣本數(shù)
★ Survival查看總生存(OS)、無病生存(DFS)和無進(jìn)展生存(PFS)分析結(jié)果
★ Clinical顯示臨床信息基線資料表托慨,以及對應(yīng)的點(diǎn)圖
★ Genomic Alterations以火山圖和分組柱形圖形式展示在不同分組中發(fā)生高頻改變的基因鼻由,將鼠標(biāo)放置在火山圖對應(yīng)散點(diǎn)或是柱形圖上會顯示對應(yīng)基因信息。
★ mRNA、Protein蕉世、Methylation蔼紧、Microbiome Signature數(shù)據(jù)的分組比較同樣會以火山圖形式展現(xiàn)
3.8:
?
★ 提供基因拷貝數(shù)信息,鼠標(biāo)懸秃萸幔可查看染色體位置奸例、起始位點(diǎn)、樣本編號等信息
3.9:
★ 根據(jù)目標(biāo)基因找到匹配的癌癥相關(guān)通路向楼,并繪制通路圖(支持自行拖拽調(diào)整)查吊。
★ 除了PathwayMapper,還可以選擇來源于NDEx的pathway信息蜜自,可按照Similarity菩貌、p-Value或Overlap進(jìn)行排序
3.10:
★ 顯示該研究下該癌癥所有類型可用數(shù)據(jù),按需下載重荠,結(jié)合其它工具進(jìn)一步分析