問題:為什么女性檢測(cè)出了Y染色體突變醇蝴?
原因說明(歡迎補(bǔ)充):
1诈火,首先昼钻,性染色體上的很多reads比對(duì)質(zhì)量一般較差,并且存在大片段同源區(qū)析二,可能會(huì)有許多錯(cuò)誤比對(duì)到性染色上的reads粉洼。咱們目前使用的最新的基于b37的hs37d5參考基因組雖然會(huì)將Y染色體同源區(qū)標(biāo)記為N,但是不能完全避免這種類似的問題,所以就算是女性属韧,也可能存在一些低質(zhì)量的reads比對(duì)到Y(jié)染色體(參考截圖1)安拟。從目前接觸到的女性的染色體覆蓋情況也可以看到,即使是女性挫剑,Y染色體的覆蓋也并不是0,如果女性也是用了Y染色體上覆蓋的信息進(jìn)行變異檢測(cè)柱衔,則可能檢測(cè)到一些突變樊破。
2,目前GATK官方仍然沒有對(duì)于性染色體的建議唆铐,一般的best practice還是整個(gè)bam文件作為輸入檢測(cè)的哲戚,但是有提到如果有需求的話,對(duì)于女性一般的解決辦法艾岂,是不去檢測(cè)Y染色體突變顺少,對(duì)應(yīng)男性的一般解決辦法,GATK 可以分開檢測(cè)X,Y染色體王浴,設(shè)置倍性為1(參考截圖2脆炎,截圖3,截圖4)氓辣。
總結(jié)及解決辦法:
綜上秒裕,如果我們沒有對(duì)男女進(jìn)行區(qū)分檢測(cè),即女性沒有避開Y染色體钞啸,則可能會(huì)出現(xiàn)女性有Y染色體突變的情況几蜻。目前的解決辦法,samtools 或者 GATK分染色體体斩,女性不檢測(cè)Y染色體突變梭稚;
備注:以下截圖及網(wǎng)址,均來自GATK官方論壇絮吵,以及broad或GATK相關(guān)開發(fā)人員的回復(fù)弧烤。
截圖1:
https://gatkforums.broadinstitute.org/gatk/discussion/2895/vqsr-and-sex-chromosomes
截圖2:
https://gatkforums.broadinstitute.org/gatk/discussion/comment/40962#Comment_40962
截圖3:
https://gatkforums.broadinstitute.org/gatk/discussion/7937/sex-chromosome-in-vcf-calling
截圖4:
https://gatkforums.broadinstitute.org/gatk/discussion/comment/51948#Comment_51948