Biomarker有助于疾病診斷善镰、判斷疾病分期或者用來(lái)評(píng)價(jià)新藥或新療法在目標(biāo)人群中的安全性及有效性。此前小編給大家解讀了一篇針對(duì)過敏性哮喘疾病年枕,利用WGCNA炫欺,鑒定關(guān)鍵模塊和hub基因,篩選Biomarker的文獻(xiàn)(鏈接)熏兄,今天將介紹一篇新的文獻(xiàn):針對(duì)多形性膠質(zhì)母細(xì)胞瘤竣稽,利用WGCNA篩選關(guān)鍵模塊中的hub基因,同時(shí)結(jié)合生存分析霍弹、ROC曲線利用其他數(shù)據(jù)庫(kù)數(shù)據(jù)進(jìn)行驗(yàn)證并篩選最終Biomarker的過程毫别。
背景簡(jiǎn)介
多形性膠質(zhì)母細(xì)胞瘤是一種非常嚴(yán)重的腦瘤,占所有類型的15%左右典格,生存時(shí)間一般少于15個(gè)月岛宦,目前主要的治療手段是外科手術(shù),但常出現(xiàn)復(fù)發(fā)耍缴。因此砾肺,通過研究其分子和結(jié)構(gòu)水平的機(jī)制將有助于疾病的治療。
數(shù)據(jù)來(lái)源
通過GEO數(shù)據(jù)庫(kù)下載GSE50161數(shù)據(jù)(34個(gè)腫瘤樣本/13個(gè)正常對(duì)照樣本)利用WGCNA防嗡,篩選hub基因变汪。
通過
TCGA下載了148個(gè)樣品的表達(dá)數(shù)據(jù)和臨床數(shù)據(jù),對(duì)hub基因進(jìn)行生存分析蚁趁,從而驗(yàn)證結(jié)果并篩選Biomarker裙盾。
再次下載
GEO數(shù)據(jù)庫(kù)數(shù)據(jù):GSE24084數(shù)據(jù),基于ROC曲線分析,對(duì)hub基因進(jìn)行驗(yàn)證番官,同樣篩選Biomarker庐完。
數(shù)據(jù)分析
下載GSE50161數(shù)據(jù),利用limma包進(jìn)行標(biāo)準(zhǔn)化處理徘熔,之后針對(duì)47個(gè)樣品的數(shù)據(jù)進(jìn)行差異表達(dá)基因的篩選门躯。以P < 0.05,|LFC|> 2酷师,共篩選了1913個(gè)差異基因(見下圖a讶凉、b),結(jié)合熱圖可以明顯發(fā)現(xiàn)這些差異基因在兩組樣品中表達(dá)變化趨勢(shì)明顯山孔。
之后缀遍,按照無(wú)尺度網(wǎng)絡(luò)的標(biāo)準(zhǔn),設(shè)定power(18)饱须,對(duì)差異基因表達(dá)數(shù)據(jù)構(gòu)建共表達(dá)網(wǎng)絡(luò)域醇,
共獲得了4個(gè)有效模塊(見下圖c、d)蓉媳。
針對(duì)模塊內(nèi)的基因譬挚,分析其表達(dá)模式,結(jié)果發(fā)現(xiàn):turquoise和 yellow兩個(gè)模塊的基因酪呻,整體上在腫瘤樣本中較之正常樣本出現(xiàn)下調(diào)减宣,blue和brown模塊表現(xiàn)相反的趨勢(shì),呈現(xiàn)上調(diào)狀態(tài)(見下圖)玩荠。
計(jì)算模塊特征基因和性狀之間的關(guān)聯(lián)漆腌,結(jié)果表明:blue和brown模塊和疾病狀態(tài)顯著正相關(guān),而turquoise和 yellow兩個(gè)模塊負(fù)相關(guān)(見下圖a),同時(shí)統(tǒng)計(jì)每個(gè)模塊中基因同性狀之間的相關(guān)性:基因顯著性GS阶冈,并計(jì)算均值(見下圖b)闷尿。
為掌握各模塊中基因的主要功能,進(jìn)行GO和KEGG富集分析女坑,最終發(fā)現(xiàn)絕大部分的顯著富集的GO term和pathway都和該疾病相關(guān)(見下表)填具。
進(jìn)一針對(duì)有效模塊進(jìn)行關(guān)鍵基因的鑒定,通過基因在模塊內(nèi)連通性的大小匆骗,從每個(gè)模塊內(nèi)篩選出TOP20的基因劳景,并利用Cytoscape繪制相關(guān)的網(wǎng)絡(luò)圖,展示如下:
生存分析驗(yàn)證篩選
基于篩選的hub基因碉就,利用TCGA數(shù)據(jù)庫(kù)下載相關(guān)的148個(gè)樣品的表達(dá)數(shù)據(jù)和臨床數(shù)據(jù)進(jìn)行生存分析盟广,最終基于每個(gè)模塊中的minimal P值,篩選出了四個(gè)基因瓮钥,分別是SULT4A1 (yellow)筋量、FXYD1 (blue),烹吵、NUSAP1 (brown),、GPR65 (turquoise)毛甲,后三者同時(shí)包含F(xiàn)XYD domain年叮。
ROC曲線驗(yàn)證篩選
下載GEO數(shù)據(jù)庫(kù)數(shù)據(jù):GSE24084數(shù)據(jù)具被,同樣對(duì)每個(gè)模塊中的hub基因進(jìn)行驗(yàn)證玻募,最終從四個(gè)模塊中獲取到了如下圖四個(gè)基因,這些基因?qū)?yīng)的|AUC-0.5|最大(作為有效的分類標(biāo)準(zhǔn))一姿。
結(jié)論
這篇文章通過WGCNA的方法獲得有效模塊之后七咧,基于常規(guī)的方式篩選獲取網(wǎng)絡(luò)中的hub基因,同時(shí)充分利用了現(xiàn)有數(shù)據(jù)叮叹,譬如結(jié)合其他數(shù)據(jù)庫(kù)中的數(shù)據(jù)或者同一數(shù)據(jù)庫(kù)不同數(shù)據(jù)集進(jìn)行驗(yàn)證和篩選艾栋,可以獲得更準(zhǔn)確高效的Biomarker進(jìn)行疾病的診斷和治療。
參考文獻(xiàn):?Yang Q, Wang R, Wei B, et al. Candidate Biomarkers and Molecular Mechanism Investigation for Glioblastoma Multiforme Utilizing WGCNA[J]. BioMed research international, 2018.
更多生物信息課程:
1. 文章越來(lái)越難發(fā)蛉顽?是你沒發(fā)現(xiàn)新思路蝗砾,基因家族分析發(fā)2-4分文章簡(jiǎn)單快速,學(xué)習(xí)鏈接:基因家族分析實(shí)操課程携冤、基因家族文獻(xiàn)思路解讀
2. 轉(zhuǎn)錄組數(shù)據(jù)理解不深入悼粮?圖表看不懂?點(diǎn)擊鏈接學(xué)習(xí)深入解讀數(shù)據(jù)結(jié)果文件曾棕,學(xué)習(xí)鏈接:轉(zhuǎn)錄組(有參)結(jié)果解讀扣猫;轉(zhuǎn)錄組(無(wú)參)結(jié)果解讀
3. 轉(zhuǎn)錄組數(shù)據(jù)深入挖掘技能-WGCNA,提升你的文章檔次翘地,學(xué)習(xí)鏈接:WGCNA-加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析
4. 轉(zhuǎn)錄組數(shù)據(jù)怎么挖掘申尤?學(xué)習(xí)鏈接:轉(zhuǎn)錄組標(biāo)準(zhǔn)分析后的數(shù)據(jù)挖掘、轉(zhuǎn)錄組文獻(xiàn)解讀
5.?微生物16S/ITS/18S分析原理及結(jié)果解讀衙耕、OTU網(wǎng)絡(luò)圖繪制昧穿、cytoscape與網(wǎng)絡(luò)圖繪制課程
6. 生物信息入門到精通必修基礎(chǔ)課,學(xué)習(xí)鏈接:linux系統(tǒng)使用橙喘、perl入門到精通粤咪、perl語(yǔ)言高級(jí)槽卫、R語(yǔ)言畫圖
7. 醫(yī)學(xué)相關(guān)數(shù)據(jù)挖掘課程被去,不用做實(shí)驗(yàn)也能發(fā)文章申鱼,學(xué)習(xí)鏈接:TCGA-差異基因分析退腥、GEO芯片數(shù)據(jù)挖掘若治、GSEA富集分析課程温兼、TCGA臨床數(shù)據(jù)生存分析俱恶、TCGA-轉(zhuǎn)錄因子分析究孕、TCGA-ceRNA調(diào)控網(wǎng)絡(luò)分析
8.其他課程鏈接:二代測(cè)序轉(zhuǎn)錄組數(shù)據(jù)自主分析比搭、NCBI數(shù)據(jù)上傳冠跷、二代測(cè)序數(shù)據(jù)解讀。