>>準備工作
安裝
下載mixcr
命令行輸入:java -jar D:\mixcr-3.0.13\mixcr.jar align input.fastq.gz output.vdjca
切換工作路勁:cd C:\mixcr-3.0.13
輸入:java -jar mixcr.jar
>>背景知識
典型的MiXCR工作流程主要由三個部分構成:
- align:將測序結果比對到T細胞或B細胞受體的V北滥、D馒铃、J纬朝、C基因參考序列上
- assemble:利用前一步驟獲得的比對結果拼接clonotypes(為了提取特定的基因區(qū)域信息洪灯,比如CDR3)
- export:輸出比對結果(exportAlignments模塊)或者clones信息(exportClones模塊)辜羊,生成可讀文件
MiXCR的assemble模塊有幾種不同的拼接方法可以選擇:
- assembleContigs:拼接完整的TCR或者IG受體clonotype序列
- 對于RNA-Seq or non-targeted DNA data, 工作流程可能包括以下兩部分:
- assemblePartial:將有重疊區(qū)域的序列片段拼接成相對較長的包含CDR3區(qū)域的contigs
- extend: 估算測序和比對質(zhì)量較好但長度較短的TCR比對序列的germline序列
為了簡化輸入命令刽射,MiXCR提供了analyze命令模塊轻掩,打包了整個分析流程
MiXCR支持一下若干種數(shù)據(jù)類型:fasta,fastq胀葱,fastq.gz漠秋,paired-end fastq和fastq.gz。作為每一步驟的輸出結果抵屿,MiXCR生成包含各種信息的二進制壓縮文件(比對生成alignments庆锦,拼接生成clones)。利用exportAlignments和exportClones命令模塊晌该,每一個二進制文件都可以轉(zhuǎn)化成tab分割的可讀文本文件肥荔。
analyze
模式,可以一站式完成(align朝群、assemblePartial燕耿、extend、assemble姜胖、assembleContigs誉帅、export) 這些分析
使用的數(shù)據(jù)來源:
第一次輸入:有錯誤
java -jar ./mixcr.jar analyze amplicon --species hs --starting-material dna --5-end v-primers --3-end j-primers --adapters adapters-present --receptor-type IGH A1_1.clean.fq A1_2.clean.fq analysis
- 不關命令行,ctrl+c即可停止正在進行的命令
hs改為mmu右莱,是小鼠的數(shù)據(jù)蚜锨,IGH改成TCR,老師沒有做過BCR的數(shù)據(jù)
改成輸入:
java -jar ./mixcr.jar analyze amplicon --species mmu --starting-material dna --5-end v-primers --3-end j-primers --adapters adapters-present --receptor-type TCR A1_1.clean.fq A1_2.clean.fq analysis
得到文件如下:
其中TRA如下:
analysis.clonotypes.TRA
用了老師給的十幾個數(shù)據(jù)的前兩個樣品慢蜓,這個文件將V亚再、D、J基因數(shù)據(jù)都囊括晨抡。
目標是得到老師要求的table氛悬,模板之一如下:
TRA.V
是將所有樣品中TRA.V的基因都整合。
老師說進一步用vdjtools的Convert過濾數(shù)據(jù)
由幫助信息可知耘柱,convert在util里面如捅,在官網(wǎng)上找到命令行
用法、幫助信息
option為加-S MiXcr调煎,表示輸入數(shù)據(jù)為mixcr結果
命令:java -jar ./vdjtools-1.2.1.jar Convert -S MiXcr analysis.clonotypes.TRA.txt output_prefix
得到結果如下:
output_prefix.analysis.clonotypes.TRA
對table的一些解讀:
這部分镜遣,標記的應該是CDR3片段上面,VDJ基因的分界點
freq就是頻數(shù)士袄。畢竟T細胞需要大量克隆悲关,才能應對特定的病變細胞。count就是TCR重復的數(shù)目娄柳。這個數(shù)目以核酸序列為準來計算的坚洽。
若最后4列是-1,則它們就不必考慮西土,這里的-1讶舰,表示沒有有效數(shù)據(jù),當作NA處理
還是V需了、D跳昼、J基因數(shù)據(jù)都整合的內(nèi)容,老師認為改用immunarch里的geneusage:
于是用immunarch里的geneusage肋乍,滑鐵盧了鹅颊,出現(xiàn)情況如下:
老師分析認為,immunarch安裝不成功是R版本太高(4.1.1)墓造,建議用3.6.3的版本堪伍。
接下來考慮R多版本共存能不能行锚烦。
安裝3.6.3后綁定rstudio,仍不能用:
選擇一下CRAN鏡像試試帝雇,找個中國區(qū)的:
chooseCRANmirror()
再次install.packages("immunarch")
下載包及其依賴的包安裝:shiny涮俄、bslib
安裝不了bslib:
要升級htmltools包,Rstudio右下方有packages框尸闸,在那邊能找到升級按鈕
更換了綁定的r版本就解決了彻亲。