胰腺導(dǎo)管腺癌的五年生存率低于5%,是目前主要致死的癌癥之一秧了。如何結(jié)合多個(gè)公開數(shù)據(jù)庫數(shù)據(jù)分析和挖掘此類癌癥臨床診斷和預(yù)后的關(guān)鍵基因呢跨扮?這里就給大家介紹一篇文獻(xiàn):基于共表達(dá)分析鑒定胰腺導(dǎo)管腺癌進(jìn)展與預(yù)后的10個(gè)關(guān)鍵基因。
數(shù)據(jù)來源
基于GEO數(shù)據(jù)庫獲取GSE62452數(shù)據(jù)(69癌癥樣本/61癌旁樣本)進(jìn)行共表達(dá)分析,借助TCGA數(shù)據(jù)庫下載的146個(gè)樣本數(shù)據(jù)衡创、GEO數(shù)據(jù)庫下載的GSE62165涉及的131個(gè)樣本數(shù)據(jù)等進(jìn)行驗(yàn)證帝嗡。
數(shù)據(jù)分析
1.GSE62452數(shù)據(jù)處理及差異分析
從GEO數(shù)據(jù)庫下載GSE62452原始數(shù)據(jù),并基于RMA算法進(jìn)行背景校正及其他標(biāo)準(zhǔn)化處理璃氢,再進(jìn)一步基于R包limma完成差異分析哟玷,以FDR<0.05 ?& |log2FC| ≥0.585為差異篩選閾值,共獲得了1008個(gè)差異基因(699 up-regulated / 309 down-reguated)一也,差異基因的表達(dá)譜和火山圖分布情況見下圖巢寡。
2.加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析
基于上一步分析篩選獲取的差異基因進(jìn)行WGCNA分析,power值選定8(R2>0.89)椰苟,共獲得4個(gè)有效模塊(見下圖A)抑月,同時(shí)結(jié)合性狀數(shù)據(jù)分析各模塊和基因之間的相關(guān)性(見下圖C),計(jì)算基因與性狀之間的GS(gene significance)舆蝴,并統(tǒng)計(jì)各模塊內(nèi)平均的GS作為MS(module significance)從而多方面衡量和選擇重要模塊進(jìn)一步分析(見下圖B)谦絮。
結(jié)合性狀關(guān)聯(lián)分析最終選定和胰腺導(dǎo)管腺癌最相關(guān)黃色模塊進(jìn)一步分析。并基于模塊內(nèi)GS與MM分析篩選出了43個(gè)基因進(jìn)行后期分析(見下圖A)须误。
3.蛋白互作分析
為探索基因之間的蛋白互作關(guān)系挨稿,利用string數(shù)據(jù)庫進(jìn)行分析仇轻,最終基于yellow模塊所有基因獲取了一個(gè)蛋白質(zhì)互作網(wǎng)絡(luò)(80 nodes and 930 edges京痢,見上圖B),從中選擇出連接點(diǎn)數(shù)超過23的所有基因篷店,一共涉及了42個(gè)基因祭椰,其中和基于模塊和性狀分析篩選的42個(gè)基因的重合有36個(gè),該部分基因?qū)⒆鳛楹蜻x進(jìn)一步驗(yàn)證疲陕。
4.篩選與驗(yàn)證
36個(gè)候選基因方淤,利用GSE62452以及TCGA數(shù)據(jù)庫數(shù)據(jù)進(jìn)行生存分析,最終篩選出10個(gè)關(guān)鍵基因 (p value<0.05,見下圖)蹄殃。
文章進(jìn)一步開展ROC曲線分析携茂,結(jié)果顯示篩選到的10個(gè)基因AUC值大于0.5(見下圖)。
此外诅岩,為探究關(guān)鍵模塊中的差異基因是否涉及癌癥相關(guān)功能讳苦,利用DAVID對(duì)yellow模塊中的所有基因進(jìn)行了富集分析,結(jié)果如下圖所示吩谦,GO分析結(jié)果顯示有絲分裂鸳谜、細(xì)胞分裂顯著富集,KEGG分析結(jié)果顯示細(xì)胞周期最為顯著(見下圖)式廷。
基于GSE62165數(shù)據(jù)庫數(shù)據(jù)進(jìn)行GSEA分析咐扭,同樣發(fā)現(xiàn)細(xì)胞周期、DNA復(fù)制、錯(cuò)配修復(fù)等顯著富集(見下圖)蝗肪。
結(jié)論
作者利用和GEO數(shù)據(jù)庫袜爪、TCGA數(shù)據(jù)庫等多項(xiàng)項(xiàng)數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘分析,并多方面的驗(yàn)證和分析結(jié)果薛闪,成功篩選到10個(gè)可能對(duì)胰腺導(dǎo)管腺癌臨床預(yù)后具有重要作用的關(guān)鍵基因饿敲。
參考文獻(xiàn)
Zhou Z , Yian C , Yinan J , et al. Ten hub genes associated with progression and prognosis of pancreatic carcinoma identified by co-expression analysis[J]. International Journal of Biological Sciences, 2018, 14(2):124-136.
如果你對(duì)TCGA數(shù)據(jù)挖掘有興趣的話,可以學(xué)習(xí)我們的TCGA相關(guān)課程逛绵。
《TCGA-生存分析》
https://study.163.com/course/introduction/1005645022.htm?share=1&shareId=1031484705
?《TCGA-ceRNA調(diào)控網(wǎng)絡(luò)分析》
https://study.163.com/course/introduction/1006360042.htm?share=1&shareId=1031484705
《TCGA-轉(zhuǎn)錄因子調(diào)控》
https://study.163.com/course/introduction/1005807030.htm?share=1&shareId=1031484705
更多技能學(xué)習(xí)鏈接:
http://m.study.163.com/provider/400000000234009/index.htm?share=1&shareId=1031484705
更多生物信息課程:
1. 文章越來越難發(fā)怀各?是你沒發(fā)現(xiàn)新思路,基因家族分析發(fā)2-4分文章簡(jiǎn)單快速术浪,學(xué)習(xí)鏈接:基因家族分析實(shí)操課程瓢对、基因家族文獻(xiàn)思路解讀
2. 轉(zhuǎn)錄組數(shù)據(jù)理解不深入?圖表看不懂胰苏?點(diǎn)擊鏈接學(xué)習(xí)深入解讀數(shù)據(jù)結(jié)果文件硕蛹,學(xué)習(xí)鏈接:轉(zhuǎn)錄組(有參)結(jié)果解讀;轉(zhuǎn)錄組(無參)結(jié)果解讀
3. 轉(zhuǎn)錄組數(shù)據(jù)深入挖掘技能-WGCNA硕并,提升你的文章檔次法焰,學(xué)習(xí)鏈接:WGCNA-加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析
4. 轉(zhuǎn)錄組數(shù)據(jù)怎么挖掘?學(xué)習(xí)鏈接:轉(zhuǎn)錄組標(biāo)準(zhǔn)分析后的數(shù)據(jù)挖掘倔毙、轉(zhuǎn)錄組文獻(xiàn)解讀
5.微生物16S/ITS/18S分析原理及結(jié)果解讀埃仪、OTU網(wǎng)絡(luò)圖繪制、cytoscape與網(wǎng)絡(luò)圖繪制課程
6. 生物信息入門到精通必修基礎(chǔ)課陕赃,學(xué)習(xí)鏈接:linux系統(tǒng)使用卵蛉、perl入門到精通、perl語言高級(jí)么库、R語言畫圖
7. 醫(yī)學(xué)相關(guān)數(shù)據(jù)挖掘課程傻丝,不用做實(shí)驗(yàn)也能發(fā)文章,學(xué)習(xí)鏈接:TCGA-差異基因分析诉儒、GEO芯片數(shù)據(jù)挖掘葡缰、GSEA富集分析課程、TCGA臨床數(shù)據(jù)生存分析忱反、TCGA-轉(zhuǎn)錄因子分析泛释、TCGA-ceRNA調(diào)控網(wǎng)絡(luò)分析
8.其他課程鏈接:二代測(cè)序轉(zhuǎn)錄組數(shù)據(jù)自主分析、NCBI數(shù)據(jù)上傳缭受、二代測(cè)序數(shù)據(jù)解讀胁澳。