一.定義
多核苷酸變異(MNV)是一種臨床和生物學(xué)上重要的遺傳變異類型,定義為存在于個體中同一單倍型上的兩個或多個相鄰變異啊片。然而记靡,現(xiàn)有的工具通常不能準(zhǔn)確地對MNV進行分類,對其突變起源的理解仍然有限咸灿。
二.基因定相(Phasing)
要把一個二倍體(甚至是多倍體)基因組上的等位基因(或者雜合位點),按照其親本正確地定位到父親或者母親的染色體上侮叮,最終使得所有來自同一個親本的等位基因都能夠排列在同一條染色體里面避矢。
三.基于reads定相識別MNV
MNV的鑒定需要對組成變異體進行適當(dāng)?shù)亩ㄏ啵礈?zhǔn)確地鑒定為發(fā)生在同一單倍型(順式)或兩種不同單倍型(反式)上的兩種變異體卸勺。分相可以按照以下三大策略進行:基于reads的分相砂沛,它評估附近的變體是否在DNA測序數(shù)據(jù)中的相同reads上共同分離;以家庭為基礎(chǔ)的分相曙求,評估兩對變異是否在家庭內(nèi)共同遺傳碍庵;以及基于群體的分相,它利用大基因型群體成員之間的單倍型共享悟狱,對分階段進行統(tǒng)計推斷静浴。基于reads的相位調(diào)整對附近的成對突變特別有效挤渐,因此適合于MNV的分析苹享。
四.MNV的全基因組突變機制
(1)不同的單核苷酸突變事件的組合,先后變異事件浴麻。MNV是兩個或更多SNV的產(chǎn)物得问,通常發(fā)生在不同的時間,因此可能具有不同的等位基因頻率白胀。由于SNV突變率的潛在差異,預(yù)計與非CpG顛換相比抚岗,CpG轉(zhuǎn)換在這一類中會更加豐富或杠。
(2)易出錯聚合酶zeta的復(fù)制錯誤,一次性事件宣蔚。DNA聚合酶zeta(pol zeta)引入的復(fù)制錯誤向抢,是一類眾所周知的復(fù)制錯誤,它引入了MNV胚委。研究表明挟鸠,pol zeta容易出現(xiàn)特定類型的復(fù)制錯誤,主要是TC-?>?AA亩冬,GC-?>?AA和它們的反向互補物艘希,實驗證據(jù)表明這些MNV模式發(fā)生在一代中硼身。
(3)重復(fù)連接處的聚合酶滑移事件,特殊序列事件覆享。復(fù)制滑移佳遂,是另一種已知的DNA復(fù)制錯誤模式。這一過程在具有重復(fù)序列背景的位點尤其頻繁撒顿。
五.MNV的影響
例如丑罪,下圖中描繪的兩個突變分別被預(yù)測為具有同義突變和錯義突變,但組合在一起會導(dǎo)致無義突變凤壁。幾乎所有現(xiàn)有的臨床變異注釋工具都會漏掉這些病例吩屹,在對受遺傳病影響的家庭進行分析時,這些病例可能會導(dǎo)致漏診和假陽性致病候選病例拧抖。
六.工具
突變檢測工具煤搜,如Mutect2、Sentieon TNScope和Sentieon TNHaplotyper 徙鱼,包括相位信息宅楞。
分相工具:bcftools csq、MAC袱吆、MACARON厌衙、varDic、COPE等绞绒。
注釋工具:SnpEff婶希、ANNOVAR、VEP等蓬衡。
七.參考文獻
1.Landscape of multi-nucleotide variants in 125,748 human exomes and 15,708 genomes
2.Misannotated Multi-Nucleotide Variants in Public Cancer Genomics Datasets Lead to Inaccurate Mutation Calls with Significant Implications
3.Watch Out for a Second SNP: Focus on Multi-Nucleotide Variants in Coding Regions and Rescued Stop-Gained