測序分析之突變分析 - Sang的文章 - 知乎
https://zhuanlan.zhihu.com/p/345568666
QD < 2.0:?variant的可靠度,它主要是防止由于測序通量過大導(dǎo)致的variant質(zhì)量的膨脹划纽,簡單來說就是伍绳,一些variant的位點相對于其他位置來說勿她,coverage很高,這樣就會使得這個位點的variant獲得很高的質(zhì)量分?jǐn)?shù),QD則會將這個分?jǐn)?shù)蝠引,根據(jù)coverage的程度進行normalisation,這樣就可以避免這種問題的出現(xiàn)
FS > 60.0:?Phred的概率分?jǐn)?shù)蛀柴,這個數(shù)值可以體現(xiàn)出突變位點是不是比正常位點更容易出現(xiàn)在正義鏈上或者反義鏈上螃概。如果FS等于0的話,說明這個位置無法判別鸽疾,也就可能是假陽性的吊洼。
MQ < 40.0:?平均的mapping quality,不過這個數(shù)據(jù)是平方根以后的數(shù)據(jù)制肮,這樣做的意義在于可以包含標(biāo)準(zhǔn)差的信息在里面冒窍。如果是一個非常好的數(shù)據(jù)递沪,那它的MQ應(yīng)該非常接近60。
SOR > 4.0:?這個是另外一個數(shù)值超燃,可以用來判斷正義鏈還是反義鏈区拳。有這個數(shù)值是因為FS對于處于exon兩端的位置具有偏向性,往往會認(rèn)為這是假陽性數(shù)據(jù)意乓,所以SOR則是用來彌補FS的功能樱调。
MQRankSum < -8.0:?這個數(shù)值是用來比較支持突變位點的reads和原始位點的reads的Mapping質(zhì)量,看一看那一邊的更加可靠届良。
ReadPosRankSum < -8.0:?這個數(shù)值是用來對比突變位點和原始位點是不是在reads的不同的位置笆凌,因為有時候突變位點會發(fā)生在reads的末尾,也就是測序質(zhì)量比較低的區(qū)域士葫,可以參考fastqc的報告乞而,如果是在reads的末尾,那么這個突變位點也就有可能是由測序錯誤造成的