為什么我得到的VCF中Allele Depth(AD)比預期的低好多姜骡?(GATK官方解答)

疑問:

當我想要通過VCF文件查看一個突變位點的變異reads支持數(shù)時贡茅,發(fā)現(xiàn)文件展示的DP (total depth) 和AD (allele depth)的數(shù)量對應不上是咋回事兒骂束?比方說咪奖,ADs中記錄的支持ref和alt的總reads數(shù)和DP中展示的總深度對應不起來,更奇怪的是治筒,有時候一個位點的AD竟然是0屉栓,HaplotypeCaller為什么會把這樣的變異call出來?有圖有真相:

2? 151214? .? G? A? 673? .? 77 .? AN=2;DP=10;FS=0.000;MLEAF=0.500;MQ=56.57;MQ0=0;NCC=0;SOR=0.693 GT:AD:DP:GQ:PL? 0/1:0,0:10:38:702,0,38

能看出來耸袜,在FORMAT這列(最后一列)顯示的支持ref和alt的AD都是0友多,但是INFO列和FORMAT列中的DP都是10。因為INFO列的DP是未經(jīng)過過濾的total depth句灌,F(xiàn)ORMAT列的DP是經(jīng)過過濾的total depth夷陋,因此可以推斷這個位置上沒有任何一個read被GATK內(nèi)置的過濾程序過濾掉。再進一步查看“bamout”文件胰锌,就會發(fā)現(xiàn)確實在這個位置上有10個reads的覆蓋骗绕。所以為什么VCF報告的AD值都是0?


原因:uninformative reads

其實這個并不能算一個bug资昧,問題出在uninformative reads上酬土。

當該read給出的most likely allele的可能性并沒有顯著大于second most likely allele時,這個read就被稱為uninformative reads格带。需要說明的是撤缴,該可能性轉(zhuǎn)換為Phred格式(Phred scaled likelihoods)后需要大于0.2才會被軟件認為是具有顯著差異导绷。換句話說舷暮,most likely allell可能性必須比second most likely allele的可能性大60%才行(因為0.2 = 10^0.2 = 1.585,約等于大60%)珠叔。

例如棺亭,我現(xiàn)在有兩條reads和兩個可能的等位基因虎眨,所有的reads都通過了HaplotypeCaller的過濾,這連個等位基因的可能性的值展示在下圖中:

現(xiàn)在把上圖中的值轉(zhuǎn)換為Phred格式镶摘,即取log值:

現(xiàn)在嗽桩,我們想看看read 1是否是imformative read,只需要看看most likely allele (A)和second most likely allele (T)的可能性差值凄敢,即-6.4122-(-6.4352)= 0.023碌冶,由于0.023少于0.2,read 1由此可判斷為uninformative涝缝。同理可以判斷出read 2 是informative扑庞。


小結:

所以譬重,如果一個read 被判定為informative,它將記錄在AD和DP中去嫩挤。如果是uninformative害幅,它只會記錄在DP中,而不記錄在AD中岂昭。AD實際上反應了究竟有多少reads支持了該位置基因型的判定,之所以沒有把uninformative記錄進去狠怨,就是因為這些read的提供的基因型判定證據(jù)不足约啊。

參考:

https://software.broadinstitute.org/gatk/documentation/article?id=11096

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市佣赖,隨后出現(xiàn)的幾起案子恰矩,更是在濱河造成了極大的恐慌,老刑警劉巖憎蛤,帶你破解...
    沈念sama閱讀 218,755評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件外傅,死亡現(xiàn)場離奇詭異,居然都是意外死亡俩檬,警方通過查閱死者的電腦和手機萎胰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,305評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來棚辽,“玉大人技竟,你說我怎么就攤上這事∏辏” “怎么了榔组?”我有些...
    開封第一講書人閱讀 165,138評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長联逻。 經(jīng)常有香客問我搓扯,道長,這世上最難降的妖魔是什么包归? 我笑而不...
    開封第一講書人閱讀 58,791評論 1 295
  • 正文 為了忘掉前任锨推,我火速辦了婚禮,結果婚禮上箫踩,老公的妹妹穿的比我還像新娘爱态。我一直安慰自己,他們只是感情好境钟,可當我...
    茶點故事閱讀 67,794評論 6 392
  • 文/花漫 我一把揭開白布锦担。 她就那樣靜靜地躺著,像睡著了一般慨削。 火紅的嫁衣襯著肌膚如雪洞渔。 梳的紋絲不亂的頭發(fā)上套媚,一...
    開封第一講書人閱讀 51,631評論 1 305
  • 那天,我揣著相機與錄音磁椒,去河邊找鬼堤瘤。 笑死,一個胖子當著我的面吹牛浆熔,可吹牛的內(nèi)容都是我干的本辐。 我是一名探鬼主播,決...
    沈念sama閱讀 40,362評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼医增,長吁一口氣:“原來是場噩夢啊……” “哼慎皱!你這毒婦竟也來了?” 一聲冷哼從身側響起叶骨,我...
    開封第一講書人閱讀 39,264評論 0 276
  • 序言:老撾萬榮一對情侶失蹤茫多,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后忽刽,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體天揖,經(jīng)...
    沈念sama閱讀 45,724評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年跪帝,在試婚紗的時候發(fā)現(xiàn)自己被綠了今膊。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,040評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡歉甚,死狀恐怖万细,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情纸泄,我是刑警寧澤赖钞,帶...
    沈念sama閱讀 35,742評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站聘裁,受9級特大地震影響雪营,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜衡便,卻給世界環(huán)境...
    茶點故事閱讀 41,364評論 3 330
  • 文/蒙蒙 一献起、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧镣陕,春花似錦谴餐、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,944評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至鹊碍,卻和暖如春厌殉,著一層夾襖步出監(jiān)牢的瞬間食绿,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,060評論 1 270
  • 我被黑心中介騙來泰國打工公罕, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留器紧,地道東北人。 一個月前我還...
    沈念sama閱讀 48,247評論 3 371
  • 正文 我出身青樓楼眷,卻偏偏與公主長得像铲汪,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子摩桶,可洞房花燭夜當晚...
    茶點故事閱讀 44,979評論 2 355