背景
T細(xì)胞介導(dǎo)的抗原識別主要是依靠T細(xì)胞受體(TCR)和主要組織相容性復(fù)合體MHC的相互作用衷笋。如下圖a:
TCR是一群具有高度多樣性的二聚體炭序,由α鏈和β鏈構(gòu)成,或者由γ鏈和δ鏈構(gòu)成山孔,后者主要出現(xiàn)在外周血中粒蜈,占1-5%。
TCR鏈由可變區(qū)和恒定區(qū)組成罐脊,α鏈或δ鏈由一段V和一段J基因編碼定嗓,β鏈或γ鏈則多了一個D基因。在VDJ的重組過程中萍桌,每個基因片段的一個隨機(jī)等位基因與其他基因片段重組形成一個功能可變區(qū)域宵溅。如下圖b:
可變區(qū)域與恒定區(qū)的重組形成功能性TCR鏈轉(zhuǎn)錄本。此外梗夸,核苷酸被隨機(jī)添加和/或刪除在基因片段之間的連接點(diǎn)层玲。這一過程導(dǎo)致了大量的重組(取決于哪些基因區(qū)域?qū)⒅亟M)和連接多樣性(哪些和多少核苷酸將被添加/刪除),從而產(chǎn)生一個大的和高度可變的TCR庫反症,這將確保識別過多的抗原辛块。多樣性是通過配對的α、β铅碍、γ润绵、δ鏈而形成的功能性TCR。
每個TCR鏈都包含3個高變的線圈(three hypervariable loops)胞谈,被命名為complementarity determining regions(CDR1-3)尘盼,CDR1和2是由V基因編碼的,是TCR與MHC復(fù)合體相互作用所必需的烦绳。CDR3是由V和J或者D和J連接的一段區(qū)域構(gòu)成卿捎,因此具有高度多樣性。CDR3因此也作為決定T細(xì)胞克隆類型的區(qū)域径密。因?yàn)閮蓚€T細(xì)胞不太可能表達(dá)相同的CDR3核苷酸序列午阵,除非它們來自相同的克隆擴(kuò)增T細(xì)胞。
一個單獨(dú)T細(xì)胞中TCRs的總數(shù)被稱為一個TCR repertoire或者叫做TCR profile。TCR庫(TCR repertoire)會隨著疾病的發(fā)生和發(fā)展而發(fā)生很大的變化底桂,這也是為什么科學(xué)家們對在不同疾病條件下植袍,如癌癥、自身免疫性疾病籽懦、炎癥性疾病和感染性疾病于个,確定其免疫庫狀態(tài)越來越感興趣的原因。例如暮顺,Muraro等人用TCR庫分析了自體干細(xì)胞移植對多發(fā)性硬化患者T細(xì)胞群的影響厅篓。在腫瘤中,細(xì)胞毒性T細(xì)胞可以殺死腫瘤細(xì)胞通過識別腫瘤特異性抗體捶码。一些研究試圖通過分析腫瘤浸潤淋巴細(xì)胞庫來確定參與這一過程的特定T細(xì)胞克隆類型贷笛。
研究免疫系統(tǒng)的主要挑戰(zhàn)是其多樣性。不同TCR基因的VDJ重組理論上可以產(chǎn)生10的15次方到10的20次方TCR鏈宙项。盡管如此,據(jù)估計株扛,人體中實(shí)際存在的克隆類型大約有10的13次方種尤筐,這意味著上述看似隨機(jī)的TCR明顯不是隨機(jī)的而是受不同的約束的。
TCR 測序
高通量測序洞就,和bulk測序pooled 免疫細(xì)胞盆繁,單細(xì)胞水平,illumina 測序平臺旬蟋,
大部分方法
目前提供測序的主流的商業(yè)公司有以下幾個:
選擇目標(biāo)序列:鏈和CDR區(qū)域
很多公司提供TCR鏈的所有文庫制備和測序服務(wù)油昂,但是α鏈和β鏈的仍然是最常見的目標(biāo),因?yàn)棣梁挺耇細(xì)胞構(gòu)成了絕大多數(shù)T細(xì)胞群倾贰∶岬縱觀歷史,β鏈?zhǔn)侵饕难芯繉ο蟠艺悖捎谒诮M成上多了一個D基因安寺,β鏈在T細(xì)胞中也是獨(dú)一無二的,反之首尼,同一個細(xì)胞可以表達(dá)兩個α鏈都是有可能的挑庶,這也增加了復(fù)雜度。γδ T細(xì)胞受體現(xiàn)在研究的不是很廣泛软能,因?yàn)棣忙?T細(xì)胞只占T細(xì)胞總數(shù)的一部分迎捺。跟αβ TCRs相比,γδ TCRs的總體多樣性就很低查排,并且有一個解刨學(xué)定位的分析凳枝,分析了γδ T細(xì)胞在粘膜位置上的豐度偏向更高,因此,在外周血樣本中對其研究興趣較小雹嗦》兑ǎ基于PCR擴(kuò)增的方法可以同時擴(kuò)增α 和β 鏈合是,但是在文庫構(gòu)建和測序的時候,人們一般會將它們分開成為兩個樣品去處理這兩個鏈锭环。這已經(jīng)被發(fā)現(xiàn)可以提高結(jié)果的準(zhǔn)確性和特異性聪全。
CDR3區(qū)域由于與TCR-肽相互作用的相關(guān)性,成為許多TCR序列研究的首選靶點(diǎn)辅辩。迄今為止难礼,CDR1和CDR2并沒有引起科學(xué)界的關(guān)注,因?yàn)樗鼈兣c抗原沒有直接相互作用玫锋。然而蛾茉,CDR1和CDR2在與MHC分子的接觸中發(fā)揮重要作用,從而影響TCR結(jié)合的敏感性和親和力撩鹿。了解包括CDR1和CDR2在內(nèi)的整個轉(zhuǎn)錄本的序列谦炬,可能是對TCR結(jié)構(gòu)及其結(jié)合特性建模的一大優(yōu)勢。并不是所有的方法都能夠檢測CDR1和CDR2节沦。這種限制尤其適用于使用多個引物序列的方案键思。事實(shí)上,許多等位基因特異性引物被設(shè)計在V基因的不同位置甫贯,常常排除了CDR3之外測序的可能性吼鳞。
文庫制備的方法:
多重PCR(Multiplex PCR)
由于TCR的多樣性,多重PCR方法是最廣泛使用的方法之一叫搁, Adaptive Biotechnologies赔桌,BGI華大基因,和iRepertoire等很多公司都提供定制服務(wù)或試劑盒渴逻。引物的恒定區(qū)J等位基因或細(xì)胞受體α和β鏈一起使用的所有已知的V等位基因的引物疾党。這導(dǎo)致了TCR轉(zhuǎn)錄本在CDR3區(qū)域的特異性擴(kuò)增。該方法可用于gDNA和RNA裸卫,并已發(fā)表的協(xié)議仿贬,確保在擴(kuò)增過程中沒有交叉引物干擾。然而墓贿,由于使用固定的引物茧泪,該方法不能檢測新的V等位基因變異。此外聋袋,多重PCR方法存在擴(kuò)增偏向性队伟,導(dǎo)致某些等位基因擴(kuò)增效果優(yōu)于其他等位基因,從而扭曲了產(chǎn)物的相對豐度幽勒。通過具體的實(shí)驗(yàn)設(shè)計(包括調(diào)整引物濃度和/或使用barcode)來糾正這種錯誤是可能的嗜侮。
目標(biāo)富集(Target enrichment)
有針對性的濃縮方法可以使用例如安捷倫的RNA baits捕捉T細(xì)胞α和β鏈。對于起始材料,gDNA或RNA首先用標(biāo)準(zhǔn)測序文庫制備試劑盒(即安捷倫公司的Illumina TruSeq或SureSelectXT)處理锈颗,然后用定制的RNA baits孵育樣本顷霹。這些RNA baits是對感興趣的序列的補(bǔ)充,與目標(biāo)相比可以耐受一些不同的堿基击吱,它們與gDNA/cDNA目標(biāo)雜交淋淀,然后允許捕獲它,并將捕獲的gDNA/cDNA提交到所需序列的進(jìn)一步放大步驟覆醇。與其他方法相比朵纷,這種方法需要更少的PCR周期,因此更不易受到PCR偏向性的影響永脓。α和β鏈也可以一起處理,同時建議獨(dú)立的處理兩個鏈其他方法以增加結(jié)果的質(zhì)量袍辞。
5'RACE cDNA 合成和巢式PCR
TCR分析的常見問題
UMI(unique molecular identifiers)
UMIs值得特別注意,UMIs能夠絕對定量RNA轉(zhuǎn)錄本的數(shù)量常摧,它包含幾個隨機(jī)的堿基搅吁,在cDNA合成的時候插入到模版中和目標(biāo)分子連接。因此落午,每一個cDNA分子都會有一個不同的UMI似芝,在數(shù)據(jù)分析的時候,通過PCRs和測序可以檢索來自同一mRNA分子的序列板甘。
測序平臺和測序深度
外包和自制的方法
數(shù)據(jù)分析
在過去的幾年中,人們開發(fā)了不同的工具和策略來進(jìn)行免疫系統(tǒng)分析详炬,其中一些已在以前的綜述中進(jìn)行了總結(jié)盐类。其他的方法,如IMSEQ, TCRklass, iMonitor, LymAnalyzer和RTRC呛谜,都是后來出現(xiàn)的在跳。一個流行的工具是MiXCR(以前是MiTCR),由Bolotin等人開發(fā)隐岛,它允許對TCR和免疫球蛋白序列進(jìn)行高度可定制的分析猫妙。這是我們選擇用于分析的工具,因?yàn)樗膮?shù)可以針對不同的數(shù)據(jù)類型聚凹、源和期望的輸出進(jìn)行優(yōu)化割坠。用于分析包含UMIs的數(shù)據(jù)的軟件是MIGEC和pRESTO。上述工具主要用于原始數(shù)據(jù)的TCR序列的恢復(fù)妒牙,以及后續(xù)的聚類和標(biāo)注等初步分析彼哼。LymAnalyzer還包含一個用于SNP調(diào)用和IGs序列突變樹生成的特性。
對免疫系統(tǒng)的進(jìn)一步(繼發(fā)性)數(shù)據(jù)分析通常包括計算一個或多個多樣性指數(shù)湘今。最廣泛使用的是香農(nóng)指數(shù)和辛普森指數(shù)敢朱,以及逆辛普森指數(shù)和基尼指數(shù)。例如,在考慮物種豐富度和數(shù)據(jù)集的均勻性等因素時拴签,它們就有所不同孝常。
分析的另一個典型步驟是計算V和J基因在不同樣本/數(shù)據(jù)集中的使用情況。不同V和J基因的使用確實(shí)不一致蚓哩。在文獻(xiàn)中构灸,有很多有偏見的基因使用的例子。對特定基因的有偏見的使用也可能是由于疾病或器官移植等特殊情況引起的基因庫改變的結(jié)果杖剪。
在Omic-tools社區(qū)(https://omictools.com/rep-seq-category)的曲目排序(Rep-seq)類別中可以找到用于次要TCR曲目分析和多樣性估計的不同工具冻押。最近的開發(fā)包括VDJtools,它能夠分析上面描述的最常見的曲目處理工具的輸出盛嘿,以及VDJviz洛巢,一個提供與VDJtools類似功能的web工具。另一個提供TCR多樣性測度和基因使用統(tǒng)計計算的工具是R package TCR次兆,它可以處理ImmunoSEQ稿茉、IMSEQ、MiTCR芥炭、MiXCR漓库、MIGEC、VDJtools等軟件的輸出文件格式园蝠。其他方法最近開發(fā)的估計識別多樣性來自Greiff et al .,形成多樣性配置文件同時使用許多多樣性系數(shù),從Laydon et al .,它引入了一個新的解決方案稱為潛水使用稀疏曲線和從Kaplinsky et al .,這使得使用基于最大似然的方法沒有完整的曲目的假設(shè)克隆豐富性渺蒿。
在處理免疫庫數(shù)據(jù)時,樣本間的一致性很重要彪薛。為此目的茂装,特別是在多樣性分析方面,向下或重新采樣是產(chǎn)生更多可比數(shù)據(jù)的常用策略善延。類似的數(shù)據(jù)類型在生態(tài)學(xué)和元基因組學(xué)研究中很容易遇到少态。因此,針對這些學(xué)科的數(shù)據(jù)分析包也可能對免疫系統(tǒng)庫分析有用易遣。已經(jīng)用于TCR數(shù)據(jù)的跨學(xué)科方法的一個例子是使用不可見物種模型估計總多樣性彼妻。例如,純素R包提供了該模型的功能豆茫,以及一系列常見的多樣性度量和估計器侨歉。關(guān)于低復(fù)雜度和高復(fù)雜度數(shù)據(jù)分析策略的更精確的信息將在其他地方詳細(xì)描述。
展望:單細(xì)胞方法
在這里揩魂,我們想簡要介紹一下目前用于TCRs單細(xì)胞分析的主要方法为肮。分析單細(xì)胞懸液中的TCR序列常用兩種方法:進(jìn)行整體轉(zhuǎn)錄組測序和推斷TCR信息;或者使用專門針對TCR轉(zhuǎn)錄本的方法。據(jù)我們所知肤京,從轉(zhuǎn)錄組數(shù)據(jù)中提取TCR信息最常用的商業(yè)工作流是通過Fluidigm公司的C1系統(tǒng)機(jī)器提供的颊艳。
針對TCR轉(zhuǎn)錄本的特異性靶向茅特,已經(jīng)建立了不同的方法,其中一些方法使用多重引物集棋枕。例如,韓寒和他的同事們使用了多重PCR方法對TCRα和β鏈排序的流式細(xì)胞儀分析細(xì)胞白修。此外,他們還在他們的設(shè)置中加入了額外的非干擾的多重引物重斑,使與T細(xì)胞相關(guān)的表型特征的表達(dá)水平的平行研究成為可能兵睛,如FOXP3、IL17A窥浪、TNF等祖很,從而提供了一個更完整的有關(guān)T細(xì)胞的圖片。另一種方法叫做pairSEQ漾脂,它采用了一種實(shí)驗(yàn)設(shè)計假颇,將樣本分成不同的子集。然后使用組合評估獨(dú)特TCRαβ鏈在每個子集骨稿。
最近笨鸡,Wafergen Biosystems推出了一種新的機(jī)器,ICELL8單細(xì)胞系統(tǒng)坦冠。這臺機(jī)器可以用于TCR測序?qū)S霉ぞ甙魏模诿绹鳷akara Bio的智能技術(shù)。10XGenomics, Inc.最近也推出了一個新的V(D)J分析專用試劑盒辙浑。特別注意到麥克丹尼爾和他的同事們發(fā)表的公開可用的工具和方法,可以用于處理數(shù)以百萬計的細(xì)胞和潛在分析所有連鎖淋巴細(xì)胞受體(TCR αβ, TCR γδ, B細(xì)胞重鏈和輕鏈)激涤。該方法為構(gòu)建專用設(shè)備提供了指導(dǎo),該設(shè)備利用了乳液PCR技術(shù)的擴(kuò)展概念判呕,在油相內(nèi)的液滴中使用引物包覆的小珠捕獲單個分子昔期,并對每個小珠進(jìn)行PCR反應(yīng)。該技術(shù)應(yīng)用于TCR分析佛玄,之前也由Turchaninova等人發(fā)表。
Chattopadhyay等人和Proserpio等人發(fā)表了關(guān)于該主題的綜述累澡,以更詳細(xì)地總結(jié)單細(xì)胞研究免疫系統(tǒng)的方法梦抢。
Results
我們使用上述兩種方法進(jìn)行實(shí)驗(yàn),這兩種方法是目前最常用的批量免疫庫測序方法愧哟,即以總RNA為起始材料的多重PCR和5種基于racbased的PCR奥吩。此外,我們基于從gDNA出發(fā)的多重PCR方法蕊梧,將我們的結(jié)果與華大基因免疫序列測序服務(wù)提供的結(jié)果進(jìn)行了比較霞赫。
在此,我們根據(jù)自己的實(shí)驗(yàn)和分析提出了一些注意事項肥矢,這可能有助于更好地理解目前所描述的方法端衰。
方法:
測序和數(shù)據(jù)分析:
RNA測序在Illumina MiSeq 250PE上進(jìn)行叠洗。華大基因使用的測序平臺為Hiseq2000 100PE。數(shù)據(jù)分析采用MiXCR (version 2.1.1)旅东,得到一個克隆型排序表灭抑,其中包括相對物種豐度、核苷酸和氨基酸CDR3序列以及相應(yīng)的VDJ等位基因作為輸出抵代。包含相同UMI的序列按照相同的UMI簽名分組腾节。對于每個UMI,只選擇最豐富的序列荤牍,其余序列考慮PCR或測序錯誤(用于UMI篩選的script作為附加文件2)案腺。華大基因提供了使用較老版本的MiXCR軟件(MiTCR)獲得的數(shù)據(jù),這就是為什么我們使用與i曲目和5場比賽數(shù)據(jù)相同的軟件版本重新處理原始數(shù)據(jù)的原因康吵。以原料為基礎(chǔ)劈榨,優(yōu)化分析參數(shù)。利用tcR R包裝的遺傳利用函數(shù)進(jìn)行基因利用分析涎才,利用純素R包裝的vegdist函數(shù)進(jìn)行多樣性分析鞋既。
BMC Published online 2017 Jul 10.