生信小課堂
本文的思路是通過單細(xì)胞數(shù)據(jù)分析識別了某種免疫細(xì)胞特有的marker基因,然后利用這些基因進(jìn)行預(yù)后模型的構(gòu)建绍哎。事實(shí)上来农,預(yù)后模型的文章已經(jīng)不好發(fā)了,甚至有的審稿人看到預(yù)后模型就反感崇堰,因?yàn)閷?shí)在是太多了沃于,而且預(yù)測效能普遍不行。那么如何做的比這篇文章還要好呢海诲?鑒于最近泛癌分析以及腫瘤分型分析比較好發(fā)繁莹,小編做的免疫細(xì)胞marker的泛癌分析以及腫瘤分型,內(nèi)容是這些文章的2倍以上特幔,均發(fā)表到8+雜志咨演。所以我們在篩選到某種免疫細(xì)胞特有的marker基因后,可以對這些基因進(jìn)行泛癌分析或者腫瘤分型分析蚯斯。在分型分析中再附上簡單的預(yù)后模型薄风,但不以其為重點(diǎn)。這樣的思路肯定是比本篇文章內(nèi)容更多拍嵌,更新穎遭赂。如果想做類似分析,歡迎交流撰茎。
研究背景:
肺癌是世界上最常見的惡性腫瘤之一嵌牺,發(fā)病率和死亡率都很高。肺鱗癌(LUSC)是肺癌的主要組織學(xué)類型之一,約占所有肺癌病例的25% - 30%逆粹。近年來募疮,免疫治療已成為一種很有前途的癌癥治療策略,但只有少數(shù)LUSC患者能從免疫檢查點(diǎn)抑制劑(immune checkpoint inhibitors, ICIs)治療中獲益僻弹。因此阿浓,尋找合適的生物標(biāo)志物來預(yù)測LUSC的預(yù)后和治療反應(yīng)非常迫切。單細(xì)胞RNA測序(scRNA-seq)對于靶向治療和免疫治療的發(fā)展具有重要意義(14)蹋绽。近年來芭毙,scRNA-seq揭示了TME中不同的免疫細(xì)胞亞群,為定義功能性生物標(biāo)志物提供了一種新方法卸耘。鑒于這一優(yōu)勢退敦,許多研究都專注于通過整合scRNA-seq和bulk RNA-seq數(shù)據(jù)來識別新的癌癥生物標(biāo)志物。
研究結(jié)果:
一蚣抗、T細(xì)胞標(biāo)記基因表達(dá)譜的鑒定
1侈百、本研究中使用的scRNA-seq數(shù)據(jù)來自2個(gè)LUSC腫瘤樣本的12950個(gè)細(xì)胞。圖1A顯示了檢測到的基因數(shù)量范圍翰铡、測序深度和每個(gè)樣本中線粒體含量的百分比钝域。
2、在對數(shù)據(jù)進(jìn)行歸一化處理后锭魔,選擇了前2000個(gè)高變量基因(圖1B)例证。
3、采用PCA方法降維(圖1C)迷捧, 15個(gè)p 值小于0.05的樣本進(jìn)行進(jìn)一步分析(圖1D)织咧。
4、從9個(gè)聚類中共鑒定了1086個(gè)差異表達(dá)標(biāo)記基因党涕。各聚類中標(biāo)記基因的相對表達(dá)量見熱圖(圖1E)烦感。
5、使用tSNE算法對9個(gè)聚類進(jìn)行可視化(圖1F)膛堤。
6手趣、使用singleR算法來注釋細(xì)胞亞群,發(fā)現(xiàn)簇2和簇4被定義為T細(xì)胞亞群(圖1G)肥荔。
二绿渣、預(yù)后模型的構(gòu)建與驗(yàn)證
1、 LASSO分析確定了基于最佳lambda值的8個(gè)T細(xì)胞marker基因和相應(yīng)的系數(shù)(圖2A, B)燕耿。
2中符、多變量Cox回歸分析得到BTG1、JUND誉帅、IER3淀散、ZNF331右莱、PSAP 5個(gè)基因(圖2C)。
3档插、根據(jù)中位TCMGrisk(中位TCMGrisk =0.973)將患者分為高危組和低危組慢蜓。TCMGrisk的散點(diǎn)圖顯示,隨著TCMGrisk評分的增加郭膛,OS降低晨抡,而死亡率上升(圖2D-I)。
4则剃、與低危組相比耘柱,高危組的生存期明顯更長(P小于0.001)(圖2J)。
5棍现、1年调煎、3年和5年訓(xùn)練隊(duì)列的AUC分別為0.614、0.713和0.702(圖2M)己肮。
6汛蝙、試驗(yàn)隊(duì)列結(jié)果顯示,低危組OS優(yōu)于高危組OS (P=0.015)(圖2K)朴肺。1、3坚洽、5年的AUC分別為0.669戈稿、0.603、0.645(圖2N)讶舰。GEO隊(duì)列結(jié)果顯示鞍盗,低危組OS優(yōu)于高危組(P=0.030)(圖2L)。1年跳昼、3年和5年的AUC分別為0.661般甲、0.628和0.590(圖2O)。
三鹅颊、特征基因的差異表達(dá)
1敷存、與正常患者相比堪伍,luc患者IER3表達(dá)上調(diào)锚烦,而JUND、PSAP和ZNF331表達(dá)下調(diào)帝雇。
2涮俄、利用HPA數(shù)據(jù)庫的免疫組化結(jié)果進(jìn)一步評估特征基因在LUSC中的表達(dá)。IER3蛋白顯著高表達(dá)LUSC組織尸闸,抗體染色強(qiáng)彻亲,染色細(xì)胞多孕锄。而JUND和PSAP蛋白在正常組織中顯著高表達(dá)。
四苞尝、諾姆圖的建立與決策曲線分析
1畸肆、通過綜合臨床因素和TCMGrisk構(gòu)建諾姆圖,分別預(yù)測LUSC患者1野来、3恼除、5年的生存概率(圖3A)。
2曼氛、標(biāo)定圖顯示豁辉,觀測值與預(yù)測值高度一致(圖3B)。
3舀患、AUC結(jié)果顯示nomogram在預(yù)測1徽级、3、5年預(yù)后方面具有更高的臨床凈效益(圖3C E)聊浅, DCA顯示nomogram在預(yù)測1餐抢、3年OS時(shí)具有最佳的臨床凈效益,而在預(yù)測5年OS時(shí)則沒有(圖3F-H)低匙。
五旷痕、基因集合富集分析
1、高危組非小細(xì)胞肺癌通路富集(圖4)顽冶。由于這些生物通路與免疫相關(guān)欺抗,并參與腫瘤免疫,進(jìn)一步分析免疫强重,比較兩組間的差異绞呈。
六、腫瘤免疫微環(huán)境和免疫相關(guān)基因的估計(jì)
1间景、免疫相關(guān)的高危組功能更活躍(圖5A)佃声。
2、相關(guān)分析顯示倘要,TCMGrisk與免疫評分圾亏、間質(zhì)評分呈正相關(guān)(圖5B、C)碗誉。
3召嘶、ESTIMATE算法結(jié)果顯示,高危組間質(zhì)評分哮缺、免疫評分弄跌、估計(jì)評分均顯著高于高危組(P小于0.001)(圖5D)。
4尝苇、ssGSEA算法結(jié)果發(fā)現(xiàn)高危組中T細(xì)胞CD4記憶靜息铛只、NK細(xì)胞激活埠胖、樹突狀細(xì)胞靜息、中性粒細(xì)胞高表達(dá)(圖5E)淳玩。
5直撤、PD-L1、CTLA-4蜕着、IDO1谋竖、PDL2、TIM-3承匣、LAG-3蓖乘、TIGIT在高危組中呈高表達(dá),而PD-1在兩個(gè)高危組中表達(dá)差異無統(tǒng)計(jì)學(xué)意義(圖5F)韧骗。
6嘉抒、高危組HLA相關(guān)基因表達(dá)水平均較高(圖5G)。
七袍暴、基因突變分析
1些侍、LUSC的總體突變概況如圖6A所示。
2政模、圖6B顯示了基因突變之間的相互作用岗宣,大多數(shù)基因之間的突變是同時(shí)發(fā)生的(P小于0.05)。
3淋样、TP53狈定、TTN和CSMD3是低危組和高危組中突變頻率最高的基因(圖6C、D)习蓬。
4、TMB表達(dá)水平在兩危組間無差異(P=0.19)(圖6E)措嵌。
5躲叼、K-M曲線顯示,高TMB組的預(yù)后優(yōu)于低TMB組(P小于0.001)(圖6F)企巢。
6枫慷、結(jié)合模型后,低危+高TMB組的預(yù)后明顯好于高危+低TMB組(P小于0.001)(圖6G)浪规。
八或听、藥物敏感性分析
1、進(jìn)一步探討低危組和高危組化療藥物IC50水平的差異(圖7A-L)笋婿。TCMGrisk可作為抗癌藥物選擇的預(yù)測因子誉裆。
總結(jié):免疫療法已成為治療癌癥的一種強(qiáng)有力的臨床策略。最近缸濒,隨著ICIs的陽性結(jié)果足丢,人們對肺癌的免疫治療重新產(chǎn)生了興趣粱腻。然而,探索能從免疫治療中獲益的LUSC患者仍然是一個(gè)巨大的挑戰(zhàn)斩跌。目前的研究表明绍些,scRNA-seq技術(shù)是探索腫瘤異質(zhì)性和不同細(xì)胞亞群的強(qiáng)大工具,這對確定潛在的治療靶點(diǎn)很重要耀鸦。在本研究中柬批,進(jìn)行了scRNAseq分析氨距,以探索LUSC中的T細(xì)胞標(biāo)記基因空厌,并使用訓(xùn)練隊(duì)列構(gòu)建預(yù)后特征。試驗(yàn)和GEO隊(duì)列被用于進(jìn)一步評估簽名的預(yù)測能力庙睡。此外著角,本研究發(fā)現(xiàn)高危組的免疫評分揪漩、基質(zhì)評分、免疫細(xì)胞浸潤吏口、免疫檢查點(diǎn)和體細(xì)胞突變水平較高奄容。在高危組中,更多的免疫相關(guān)通路也被富集产徊。