第23周 2018 — 10.21-10.27
原文鏈接: Application of weighted gene co-expression network analysis to identify key modules and hub genes in oral squamous cell carcinoma tumorigenesis
DOI:10.2147/OTT.S171791
期刊:Onco Targets Ther.
影響因子:2.656
導(dǎo)讀
這是一篇完全基于公共數(shù)據(jù)挖掘壶愤,沒有做任何實驗的文章,充分利用了多種數(shù)據(jù)庫喇辽、網(wǎng)絡(luò)軟件和工具,除了WGCNA的分析過程献烦,其他部分不需要編程基礎(chǔ)与帆。而WGCNA的分析教程太多太多墨榄,優(yōu)秀的如:
另外值得一提的是這篇文章發(fā)表的期刊:OncoTargets and Therapy玄糟,影響因子2.656,但是見刊速度驚人袄秩,從投稿到見刊總用時平均不超過2個月。如果是急于畢業(yè)等需要這種類型的文章贮喧,這篇文章的研究方法(套路)可以參考猪狈,該類型的期刊也可以關(guān)注下。
研究方法
用到的數(shù)據(jù)庫詳細(xì)介紹
1. GEPIA (http://gepia.cancer-pku.cn/)
Tang, Z. et al. (2017) GEPIA: a web server for cancer and normal gene expression profiling and interactive analyses. Nucleic Acids Res, 10.1093/nar/gkx247.
GEPIA是2017年北京大學(xué)開發(fā)的一個腫瘤和正潮缒眨基因表達(dá)的集分析和可視化的交互網(wǎng)站平臺灶伊。目前包括9736個腫瘤樣本和8587個正常樣本,數(shù)據(jù)分別來自TCGA數(shù)據(jù)庫和GTEx聘萨。
可以做的分析有:
-
單個基因分析:
任意輸入一個基因symbol米辐,General信息里會給出該基因研究現(xiàn)狀的一個summary书释;基因的平均表達(dá)值在tumor和normal的bodymap中的分布赊窥;在不同癌癥
癌癥類型中的表達(dá)(包括dot plot, bar plot); 還給出了該基因的相似基因。同時還包括差異分析扯再,定制表達(dá)譜圖分析址遇,生存分析,相關(guān)性分析饺律,PCA等跺株。
-
癌癥類型分析:
給定一個癌癥類型乒省,用常用的統(tǒng)計學(xué)方法和閾值做差異基因分析以及基因在染色體上的分布;還包括和癌癥類型最顯著相關(guān)的基因的生存分析 -
多個基因分析:
包括多個基因比較袖扛,相關(guān)性分析蛆封,降維 -
應(yīng)用范圍:
該數(shù)據(jù)庫主要用于癌癥分析,如果有感興趣的基因惨篱,可以使用該網(wǎng)站做差異砸讳、聚類、相關(guān)性和生存分析漾抬。
2. Human Protein Atlas database (https://www.proteinatlas.org/)
人類蛋白質(zhì)數(shù)據(jù)庫是2003年由瑞典人發(fā)起的常遂,旨在利用不同的組學(xué)技術(shù)(包括抗體成像、質(zhì)譜平绩、轉(zhuǎn)錄組學(xué)和系統(tǒng)生物學(xué)等方法)繪制細(xì)胞、組織和器官中的所有人類蛋白質(zhì)圖譜馒过。
包括三部分腹忽,組織、細(xì)胞和致病圖譜:
-
Tissue Atlas
展示蛋白質(zhì)在人體組織和器官的分布
Uhlén M et al, 2015. Tissue-based map of the human proteome. Science, PubMed: 25613900 DOI: 10.1126/science.1260419
-
Cell Atlas
展示蛋白的的亞細(xì)胞定位
Thul PJ et al, 2017. A subcellular map of the human proteome. Science.PubMed: 28495876 DOI: 10.1126/science.aal3321
-
Pathology Atlas
展示蛋白質(zhì)水平對癌癥患者生存的影響
Uhlen M et al, 2017. A pathology atlas of the human cancer transcriptome.
Science.PubMed: 28818916 DOI: 10.1126/science.aan2507
使用介紹:
輸入一個基因嘹锁,會給出該基因的相關(guān)蛋白的描述着裹,亞細(xì)胞定位等
再看看Tissue/Cell/Pathology都包括哪些內(nèi)容:
應(yīng)用范圍:
這篇文章中是利用該數(shù)據(jù)庫對hub genes在蛋白質(zhì)水平上驗證骇扇。做腫瘤數(shù)據(jù)挖掘的可以利用該數(shù)據(jù)庫對感興趣的基因進(jìn)行蛋白質(zhì)驗證少孝,不用做實驗,故事還可以說的更飽滿些袁翁。(數(shù)據(jù)庫內(nèi)容很多婿脸,之后詳細(xì)介紹。)
3. CBioPortal (http://www.cbioportal.org/)
cBioPortal for Cancer Genomics 提供了探索焙压、可視化和分析多種維度的癌癥基因組數(shù)據(jù)的網(wǎng)站資源褪迟〈疸荆可以探索基因變異對臨床的影響,包括多種可視化方法心俗。
文章結(jié)果
(1) WGCNA的分析結(jié)果:
-
樣本聚類和軟閾值的選擇
-
構(gòu)建共表達(dá)網(wǎng)絡(luò)
-
顯著性模塊的選擇
-
提取顯著性模塊中的hub genes, 用cytoscape做網(wǎng)絡(luò)圖
-
模塊基因的GO和KEGG富集分析
(2) Hub genes的驗證結(jié)果
-
用GEPIA數(shù)據(jù)庫對hub genes進(jìn)行生存分析
-
差異基因和模塊基因的關(guān)聯(lián)分析,相互驗證
-
轉(zhuǎn)錄本水平驗證
-
翻譯水平驗證
用的Human Protein Atlas database數(shù)據(jù)庫
用CBioPortal對基因組變異和hub genes關(guān)聯(lián)分析
雖然這篇文章屬于套路文章,利用的也都是公共數(shù)據(jù)資源和工具喘垂,但是也有值得借鑒的地方正勒,利用WGCNA找到hub genes后,從轉(zhuǎn)錄本水平章贞、翻譯水平鸭限、臨床結(jié)果和基因組變異多個角度驗證;還有文中提到的3個公共數(shù)據(jù)庫資源值得挖掘和利用败京,尤其是對做實驗的同學(xué),完全可以用別人的工具驗證分析結(jié)果虹统,繪制好看的圖隧甚。
君子生非異也,善假于物也忧便。