????大家好双泪,今天和大家分享的是今年3月份發(fā)表在Shock(IF:3.083)的一篇非腫瘤生信文章坞古,“S1PR1-associated Molecular Signature Predicts Survival in Patients with Sepsis ”梆惯,本文作者通過(guò)生信手段去分析敗血癥患者的預(yù)后與已知預(yù)后相關(guān)基因S1PR1的相關(guān)基因的關(guān)系酱鸭,快來(lái)學(xué)習(xí)一下吧!
S1PR1-associated Molecular Signature Predicts Survival in Patients with Sepsis
S1PR1相關(guān)的特征基因預(yù)測(cè)敗血癥患者的預(yù)后
https://space.bilibili.com/400148106
一.文章背景
敗血癥(Sepsis)是在感染情況下可能產(chǎn)生的威脅患者生命的一種并發(fā)癥垛吗,而研究表明磷酸-1-鞘氨醇(Sphingosine-1-phosphate凹髓,S1P)及其受體S1PR1是敗血癥可能的治療靶點(diǎn)以及分子標(biāo)志物∏犹耄基于以上背景蔚舀,作者在本文中通過(guò)GEO數(shù)據(jù)庫(kù)中研究敗血癥患者的外周血芯片數(shù)據(jù)去識(shí)別S1PR1相關(guān)的特征基因并以此預(yù)測(cè)敗血癥患者的預(yù)后狀況。
二. 文章思路
三. 結(jié)果解析
1.識(shí)別生存相關(guān)基因和S1PR1相關(guān)基因
作者從GEO數(shù)據(jù)庫(kù)獲取了GSE54514和GSE33118這兩個(gè)研究敗血癥患者的外周血芯片數(shù)據(jù)集锨络,樣本組成如下赌躺,分為存活者和未存活者兩類情況。其中GSE54514樣本量多作為探索數(shù)據(jù)集羡儿,GSE33118則作為驗(yàn)證集礼患。
表1. 數(shù)據(jù)集信息 1. 關(guān)于S1PR1相關(guān)基因的識(shí)別,作者通過(guò)兩種方法
第一種方法是基因共表達(dá)分析(通過(guò)E-MTAB-4421數(shù)據(jù)集去分析失受,含265名敗血癥患者的芯片數(shù)據(jù))讶泰,作者通過(guò)分析基因表達(dá)量間相關(guān)性,找到557個(gè)與S1PR1有共表達(dá)關(guān)系的基因(表達(dá)量上調(diào)或下調(diào)的基因都被認(rèn)為是S1PR1相關(guān)基因拂到,|r|>0.4痪署,F(xiàn)DR<0.05)。
第二種方法是用STRING數(shù)據(jù)庫(kù)從蛋白質(zhì)互相作用角度去分析和S1RP1相關(guān)的基因兄旬,一共找到233個(gè)基因與S1PR1之間在蛋白質(zhì)層面有較高的互作分?jǐn)?shù)(interaction score>0.7)狼犯。
關(guān)于與敗血癥相關(guān)的生存相關(guān)基因余寥,通過(guò)在敗血癥非存活者樣本(n=9)和存活者樣本(n=26)間的差異分析尋找與尋找。一共分析出1078個(gè)表達(dá)量上調(diào)的基因和1134個(gè)表達(dá)量下調(diào)的基因(limma包悯森,F(xiàn)C>1.2宋舷,F(xiàn)DR<0.05)。
????????在找出兩種方法的S1PR1相關(guān)基因后瓢姻,分別于敗血癥患者的生存相關(guān)基因取交集(圖1C祝蝠,圖2B),分別得到62個(gè)特征基因和16個(gè)特征基因幻碱。之后對(duì)兩種方法得到的基因(圖1A,圖2B)绎狭,生存相關(guān)基因(圖1.B),以及取交集后的基因(圖1.D褥傍,圖2.C)做KEGG通路分析得到圖一和圖二的結(jié)果儡嘶。圖2D是在Cytoscape中用MCODE插件對(duì)STRING中獲得的蛋白質(zhì)相互作用網(wǎng)路做富集分析。
圖1.第一種方法選出的62個(gè)特征基因
圖2.第二種方法選出的16個(gè)特征基因
2.用S1PR1特征基因預(yù)測(cè)敗血癥患者的預(yù)后
圖3E圖4E是分別做探索集中存活者和非存活者恍风,其結(jié)果1中得到的兩種S1PR1特征基因的表達(dá)量熱圖蹦狂,可以看到兩類型樣本在特征基因的表達(dá)量上有很大差異。
而圖3.4中的生存曲線則是根據(jù)樣本在特征基因總表達(dá)量上的中位值將樣本分為高低表達(dá)組后進(jìn)行生存分析朋贬。兩類S1PR1特征基因都有顯著的預(yù)后價(jià)值凯楔。低表達(dá)組有更差的預(yù)后水平。
圖3.62個(gè)特征基因的預(yù)后分析
圖4. 16個(gè)特征基因的預(yù)后分析
3.構(gòu)建風(fēng)險(xiǎn)得分公式并評(píng)估效果
作者在用生存分析確定S1PR1特征基因有預(yù)后價(jià)值后兄世,下一步構(gòu)建風(fēng)險(xiǎn)得分公式啼辣,如下,作者通過(guò)對(duì)各組樣本特征基因的表達(dá)量做z分?jǐn)?shù)標(biāo)準(zhǔn)化御滩,風(fēng)險(xiǎn)得分就是各特征基因z分?jǐn)?shù)的線性加和,權(quán)重僅考慮該基因和S1PR1表達(dá)量上的相關(guān)性党远,即正相關(guān)Wi就取1削解,負(fù)相關(guān)Wi就取-1。(用Cox回歸分析會(huì)不會(huì)更好呢沟娱?)
風(fēng)險(xiǎn)得分計(jì)算公式
????????根據(jù)兩類特征基因的風(fēng)險(xiǎn)得分公式分別計(jì)算樣本的風(fēng)險(xiǎn)得分后氛驮,在探索集和驗(yàn)證集中觀察兩類樣本在風(fēng)險(xiǎn)得分上的差異(圖5A.圖6A)。之后用ROC(受試者功能曲線)法去檢驗(yàn)兩類風(fēng)險(xiǎn)得分在探索集和驗(yàn)證集中對(duì)敗血癥患者預(yù)后的區(qū)分能力(圖5B.圖6B)济似。
圖C做的是從全部基因組中抽出相同數(shù)量的特征基因(10000次)矫废,用相同方法去構(gòu)建風(fēng)險(xiǎn)得分公式并用ROC曲線法去檢驗(yàn)其能力,通過(guò)核密度圖去和前文得到的兩類特征基因的分類能力做比較砰蠢,相當(dāng)于做了置換檢驗(yàn)蓖扑。從圖中可以看出作者兩類特征基因的分類能力確實(shí)要比隨機(jī)產(chǎn)生的特征基因的預(yù)測(cè)能力好。意義在于檢驗(yàn)是否存在隨機(jī)的特征基因會(huì)有更好的預(yù)測(cè)能力(David Venet et al 2011年的一篇文章中提到過(guò)此方法)台舱。
圖5.62個(gè)特征基因的分類能力
圖6.16個(gè)特征基因的分類能力
????????最后作者還用PCA法去檢驗(yàn)兩類特征基因在探索集和驗(yàn)證集中的分類能力律杠。作者選了三個(gè)維度,可以看到兩類特征基因在探索集中的分類能力較好,但在驗(yàn)證集中仍存在一些非存活樣本和存活樣本混合的情況柜去。
圖7. 62個(gè)特征基因的分類能力PCA
圖8.16個(gè)特征基因的分類能力PCA
小結(jié)
????????那么今天的文獻(xiàn)分享到這里就結(jié)束了灰嫉,本文所作的工作并不多,無(wú)非是選了兩個(gè)帶有預(yù)后信息的敗血癥樣本的芯片數(shù)據(jù)集嗓奢,通過(guò)兩種方法找到已知預(yù)后標(biāo)志基因S1PR1的相關(guān)基因與差異分析得到的敗血癥患者預(yù)后相關(guān)基因取交集讼撒,通過(guò)線性加權(quán)做風(fēng)險(xiǎn)得分,最后直觀比較兩組在風(fēng)險(xiǎn)得分的差異股耽,ROC法根盒,PCA法檢驗(yàn)分類能力。中間還有必須的對(duì)基因的功能富集分析豺谈,表達(dá)量熱圖等郑象。文章通過(guò)生信手段對(duì)非腫瘤疾病預(yù)后的分析步驟清晰,適合我們學(xué)習(xí)茬末。