概念提出背景
腫瘤抗原根據(jù)其特異性可大致分為兩類:腫瘤特異性抗原衰抑,只存在于腫瘤細(xì)胞中匙监;腫瘤相關(guān)抗原新荤,在腫瘤細(xì)胞中過度表達(dá)或異常表達(dá)揽趾,在一些正常細(xì)胞中也有表達(dá)。
除了異常的表達(dá)模式外苛骨,腫瘤細(xì)胞還含有一系列的癌癥體細(xì)胞突變篱瞎,蛋白質(zhì)編碼區(qū)的突變可能會(huì)產(chǎn)生腫瘤特有的突變蛋白。來自這些腫瘤特異性突變蛋白的腫瘤抗原是無可比擬的腫瘤生物標(biāo)志物痒芝,因?yàn)樗鼈冎挥赡[瘤細(xì)胞產(chǎn)生俐筋,是潛在的腫瘤特異性突變抗原或新抗原。
簡單來說:腫瘤新生抗原(Neoantigen)是源于腫瘤細(xì)胞中的突變基因的表達(dá)严衬,是一類腫瘤特異性抗原(TSAs)澄者,并不存在于正常的組織器官當(dāng)中
有些使用tumor-specific neoantigen(TSN)概念,有些使用的是Neoantigen Load(NAL)概念瞳步,腫瘤新抗原負(fù)荷(TNB)
腫瘤新抗原突變負(fù)荷意義
腫瘤特異性新抗原闷哆,可以作為生物標(biāo)志物來預(yù)測(cè)免疫檢查點(diǎn)阻斷療法的治療效果,并作為癌癥免疫療法的潛在目標(biāo)单起。
在免疫檢查點(diǎn)阻斷療法中,新抗原負(fù)荷與療效相關(guān)(即PD-1劣坊、CTLA-4阻斷)嘀倒,表明新抗原負(fù)荷是癌癥免疫療法中的一個(gè)重要生物標(biāo)志物。
數(shù)據(jù)計(jì)算
生物信息學(xué)主要通過相應(yīng)的機(jī)器學(xué)習(xí)方法進(jìn)行計(jì)算預(yù)測(cè)局冰,相關(guān)的預(yù)測(cè)方法
這次發(fā)現(xiàn)的這個(gè)數(shù)據(jù)庫使用的方法是NetMHCpan 2.8 (4.0)测蘑。
通過生物信息學(xué)方法預(yù)測(cè)新抗原主要是關(guān)注于多肽MHC結(jié)合親和力、蛋白酶體剪切康二、抗原轉(zhuǎn)運(yùn)蛋白(TAP)轉(zhuǎn)運(yùn)效率碳胳、表達(dá)豐度、腫瘤異質(zhì)性沫勿、克隆性和HLA LOH(雜合性缺失)挨约,相關(guān)的工具及算法相當(dāng)多,比如:IEDB(Immune Epitope Database)是一個(gè)抗體和T細(xì)胞表位實(shí)驗(yàn)數(shù)據(jù)的數(shù)據(jù)庫产雹,同時(shí)整合了一些T細(xì)胞表位預(yù)測(cè)的工具诫惭,NetMHCpan4.0整合親和力和洗脫配體數(shù)據(jù)進(jìn)行MHC-I分子相關(guān)作用預(yù)測(cè)。而怎樣選擇計(jì)算機(jī)模擬工具和設(shè)置相關(guān)閾值精準(zhǔn)地挑選出具有免疫原性的新抗原是個(gè)不小的挑戰(zhàn)蔓挖。
目前腫瘤新生抗原在開發(fā)上主要的挑戰(zhàn)是如何準(zhǔn)確地預(yù)測(cè)出真正的腫瘤新生抗原夕土,由于其遞呈過程多樣、機(jī)制復(fù)雜瘟判,因此預(yù)測(cè)過程也不能是簡單的線性疊加怨绣。對(duì)預(yù)測(cè)出的腫瘤新生抗原需要進(jìn)行TCR反應(yīng)性的驗(yàn)證(酶聯(lián)免疫斑點(diǎn)試驗(yàn)ELISPOT角溃,四聚體等技術(shù)),由于實(shí)驗(yàn)成本等因素導(dǎo)致了驗(yàn)證性數(shù)據(jù)相對(duì)較少篮撑。而基于機(jī)器學(xué)習(xí)和AI技術(shù)的預(yù)測(cè)算法需要通過驗(yàn)證性數(shù)據(jù)集的不斷訓(xùn)練减细,其中數(shù)據(jù)類型、質(zhì)量及體量都會(huì)極大地影響算法精確度咽扇。
總結(jié)一下:
1.腫瘤產(chǎn)生新抗原的過程很復(fù)雜邪财,算法可能存在偏倚,不一定預(yù)測(cè)準(zhǔn)確质欲。
2.算法的優(yōu)化和選擇树埠,未來還需要進(jìn)一步深入。
3.實(shí)驗(yàn)成本比較高嘶伟,驗(yàn)證數(shù)據(jù)少怎憋。
數(shù)據(jù)獲得
經(jīng)過研究,TNB還是很有前景九昧,計(jì)算方法和預(yù)測(cè)方法挺復(fù)雜绊袋。但是,有研究者把TCGA的數(shù)據(jù)進(jìn)行了計(jì)算铸鹰,直接拿來用就可以癌别。TSNAdb,浙江大學(xué)的團(tuán)隊(duì)做的蹋笼。
下載后展姐,主要的數(shù)據(jù)有以下內(nèi)容
[1] "tissue" "gene" "mutation"
[4] "ENSG" "ENST" "nuc_mut"
[7] "chromosome" "start" "end"
[10] "position in peptide" "HLA" "wild_peptide"
[13] "wild_Affinity" "wild_%Rank" "wild_Bindlevel"
[16] "mut_peptide" "mut_Affinity" "mut_%Rank"
[19] "mut_Bindlevel" "frequency_in_tissue" "frequency_in_all"
對(duì)于每一項(xiàng)的解釋,可以在文檔中找到剖毯,About – TSNAdb圾笨,具體如何分組,并進(jìn)行分析就要結(jié)合自己的數(shù)據(jù)和想法了逊谋。
參考文章
TSNAdb
TSNAdb: A Database for Tumor-specific Neoantigens from Immunogenomics Data Analysis
TSNAD: an integrated software for cancer somatic mutation and tumour-specific neoantigen detection
Characterization of Neoantigen Load Subgroups in Gynecologic and Breast Cancers (frontiersin.org)
如何看懂基因檢測(cè)報(bào)告之腫瘤突變負(fù)荷(TMB)
腫瘤新生抗原小科普