原文鏈接:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9537943/
背景:
癌癥相關(guān)成纖維細(xì)胞 (CAF) 參與腫瘤生長甸赃、血管生成、轉(zhuǎn)移和治療耐藥性。我們試圖探索肝細(xì)胞癌(HCC)中的CAF特征溺职,并建立基于CAF的風(fēng)險(xiǎn)特征來預(yù)測肝細(xì)胞癌患者的預(yù)后。
工具鏈接:
http://www.sxdyc.com/CAFriskModel
1玲昧、單細(xì)胞數(shù)據(jù)讀取
這里需要注意窟蓝,單細(xì)胞目前的數(shù)據(jù)有三種格式罪裹,如果不清楚,可以查看之前的文檔
http://www.sxdyc.com/clusteringReduction
這里我們提供了三種格式的文件
我們以10x的數(shù)據(jù)為例
文件夾的名字就是樣本的名字,記得不要太長状共,也不要以數(shù)字開頭套耕,每一個(gè)文件夾包含了三個(gè)文件
全選這四個(gè)文件夾,壓縮為zip口芍,然后上傳即可
提交后設(shè)置任務(wù)名箍铲,等待運(yùn)行成功即可。
運(yùn)行完成后鬓椭,點(diǎn)擊文件下載
2、單細(xì)胞數(shù)據(jù)過濾
這里選擇的閾值?100<umi<50000关划,100<單個(gè)細(xì)胞表達(dá)的基因數(shù)量<5000小染,線粒體的含量小于10%
3、去批次
選擇去批次的方法贮折,當(dāng)然你也可以選擇不去批次裤翩,如果這里選擇none的話,那么結(jié)果得到的兩個(gè)圖片和第二步結(jié)果是一樣的
4调榄、第一次聚類篩選特定的細(xì)胞亞群
選擇合適的分辨率踊赠,上傳特征基因的名字,如這里做的CAF細(xì)胞每庆,選擇的是ACTA2,FAP,FDGFRB,NOTCH3這四個(gè)基因筐带,輸入的這些基因 為CAF的marker基因,后面用于篩選CAF的亞群
5缤灵、特定亞群的二次聚類
在第四步中亞群3為成纖維細(xì)胞伦籍,我們提取亞群3進(jìn)行二次聚類
6、marker基因的篩選及可視化
篩選CAF小亞群的marker基因
7腮出、copykat預(yù)測惡性細(xì)胞
8帖鸦、腫瘤相關(guān)通路評分的比較
9、TCGA數(shù)據(jù)準(zhǔn)備
準(zhǔn)備一個(gè)生存數(shù)據(jù)
如果是表型缺失胚嘲,怎么輸入U(xiǎn)nknown
10作儿、新增數(shù)據(jù)集(可選)
如果這里有GEO的數(shù)據(jù)集,那這時(shí)候準(zhǔn)備一個(gè)表達(dá)譜和生存數(shù)據(jù)
其中表達(dá)譜的行為基因馋劈,列為樣本攻锰,生存數(shù)據(jù)包含三列
記得這里的數(shù)據(jù)集名字,不要出現(xiàn)中文侣滩,空格口注,特殊符號等等,這里可以輸入多個(gè)數(shù)據(jù)集君珠,分批次進(jìn)行上傳
11寝志、關(guān)鍵亞群豐度在腫瘤發(fā)生中的比較(可選)
如果該腫瘤有癌組織和癌旁組織,則可以選擇使用ssGSEA的方法預(yù)測TCGA的每一個(gè)人關(guān)于CAF小亞群的豐度。
當(dāng)然材部,也可以不做差異比較
12毫缆、關(guān)鍵亞群的KM曲線
13、關(guān)鍵亞群相關(guān)基因集的篩選
如果有正常組織和癌組織乐导,可以選擇差異分析+相關(guān)性分析進(jìn)行篩選關(guān)鍵的基因
如果沒有正常組織和癌組織苦丁,就不選擇進(jìn)行差異分析,只通過相關(guān)性分析物臂,篩選相關(guān)基因
14旺拉、基于關(guān)鍵亞群構(gòu)建風(fēng)險(xiǎn)模型
接下來使用單因素cox+lasso+逐步回歸+多因素cox分析構(gòu)建風(fēng)險(xiǎn)模型
15、獨(dú)立數(shù)據(jù)驗(yàn)證風(fēng)險(xiǎn)模型的魯棒性
通過獨(dú)立數(shù)據(jù)機(jī)驗(yàn)證風(fēng)險(xiǎn)模型的魯棒性
這里為什么出現(xiàn)這個(gè)問題呢棵磷?是因?yàn)樵摂?shù)據(jù)集的生存時(shí)間轉(zhuǎn)化為年蛾狗,這個(gè)非常重要,如果不行仪媒,則跳回第十步重新運(yùn)行
16沉桌、臨床表型的預(yù)后分析
這里有6個(gè)表型,就需要準(zhǔn)備6+2=8個(gè)顏色
長寬不合適可自行調(diào)整
17算吩、module基因的突變分析
18留凭、module基因的相關(guān)性分析
19、module基因的GSVA分析
20偎巢、module基因與免疫的相關(guān)性分析
21蔼夜、免疫治療效果的比較
使用IMvigor210數(shù)據(jù)+GSE78220驗(yàn)證高低風(fēng)險(xiǎn)免疫治療響應(yīng)和不響應(yīng)的比較
The responsiveness of risk score to PD-L1 blockade immunotherapy in IMvigor210 cohort. (A) Differences in risk scores among immunotherapy responses in the IMvigor210 cohort; (B) Distribution of immunotherapy responses among risk score groups in the IMvigor210 cohort; (C) Prognostic differences among risk score groups in the IMvigor210 cohort; (D) Prognostic differences between risk score groups in early stage patients in the IMvigor210 cohort; (E) prognostic differences between risk score groups in advanced patients in the IMvigor210 cohort; (F) prognostic differences in risk score groups in the GSE78220 cohort; (H) Distribution of immunotherapy responses among risk score groups in the GSE78220 cohort. ****P < 0.0001.
g:gse78220數(shù)據(jù)集中免疫治療響應(yīng)與不響應(yīng)風(fēng)險(xiǎn)得分的比較。
####################################
到這一步該文章基本就已經(jīng)完全復(fù)現(xiàn)了艘狭。
如果不清楚挎扰,可以仔細(xì)看一下原文。
嗶哩嗶哩鏈接:https://www.bilibili.com/video/BV1PF4m1A7D8/?spm_id_from=333.337.search-card.all.click
官網(wǎng)鏈接:http://www.sxdyc.com/course?courseId=8d5b3d10057b4fd0aa7c2eb6cfc15200
工具鏈接:http://www.sxdyc.com/CAFriskModel