背景
這是一篇文獻(xiàn)(DNA damage is a major cause of sequencing errors, directly confounding variant identification.)的簡(jiǎn)單介紹还最。
NGS 用于腫瘤細(xì)胞的體細(xì)胞突變的檢測(cè)有著重要的意義算途。由于腫瘤細(xì)胞的異質(zhì)性以及正常細(xì)胞的背景髓削,腫瘤細(xì)胞的用藥相關(guān)的基因突變往往是低豐度的。而低豐度的突變會(huì)受到PCR錯(cuò)誤石景、測(cè)序錯(cuò)誤、DNA損傷的影響,帶來(lái)很多假突變织咧。其中DNA損傷帶來(lái)的影響尤為嚴(yán)重幸乒。
FFPE DNA, 時(shí)間久遠(yuǎn)的DNA懦底,ctDNA 都會(huì)受到損傷的影響。公共數(shù)據(jù)庫(kù)罕扎,1000 Genomes Project 和 TCGA 中的數(shù)據(jù)大部分也存在DNA損傷聚唐。
全局不平衡值(GIV) 衡量DNA Damage
為了檢測(cè)DNA損傷對(duì)突變檢測(cè)的影響,文章使用illumina 文庫(kù)準(zhǔn)備流程腔召,使用雙端測(cè)序杆查。連上接頭序列的雙鏈模板DNA,在測(cè)序中讀為 R1臀蛛,而他們的互補(bǔ)鏈則讀為 R2根灯。
DNA損傷會(huì)造成DNA雙鏈中的一條鏈引入錯(cuò)誤的堿基,從而導(dǎo)致R1中的某一種突變類型(例如:G-T) 遠(yuǎn)遠(yuǎn)超過(guò)R2。如圖:
基于這種不平衡設(shè)計(jì)了一組 GIV 值來(lái)檢查DNA damge: https://github.com/Ettwiller/Damage-estimator
- C1v : R1 中G→T的突變數(shù)量烙肺;
- C1 : R1 中G 的總量纳猪;
- C2v: R2中C→A的突變數(shù)量;
- C2: R2中C的總量桃笙;
- C1v_RC: R1中C→A的突變數(shù)量氏堤;
- C1_RC: R1中 C 的總量;
- C2v_RC: R2中 G→T的突變數(shù)量搏明;
- C2_RC: R2中 G 的總量鼠锈。
文章中,認(rèn)為GIV 的值超過(guò)1.5表示有嚴(yán)重的損傷星著,暗示至少有三分之一的突變是錯(cuò)誤的购笆。沒(méi)有DNA損傷的話IGV值應(yīng)該是1。
DNA氧化損傷
使用DNA 修復(fù)試劑盒可以顯著降低損傷虚循。同時(shí)同欠,DNA 破碎的緩沖液環(huán)境也是避免氧化損傷的重要部分。
由DNA 損傷引入的測(cè)序錯(cuò)誤横缔,并不會(huì)降低測(cè)序的堿基質(zhì)量值铺遂,提高突變檢測(cè)的質(zhì)量值無(wú)法去除這些錯(cuò)誤。
DNA 的氧化損傷沒(méi)有序列的特異性茎刚,在DNA上隨機(jī)發(fā)生襟锐。
氧化損傷影響的突變分度范圍
氧化損傷形成的假突變豐度大部分在5%以下,其中1%-5%區(qū)間的突變膛锭,對(duì)我們突變檢測(cè)的影響最大粮坞。因?yàn)檫@些突變有足夠的reads證據(jù)支持,容易保留初狰。