在分析高通量測序數(shù)據(jù)的時候误算,我們會對Q20/Q30不陌生。那么Q20/Q30是什么意思呢迷殿?又是怎么來的呢儿礼?
Q20,Q30它們代表的是某一堿基質(zhì)量值占全部堿基數(shù)的百分比庆寺,就類似于產(chǎn)品合格率蚊夫,不同的質(zhì)量標準會產(chǎn)生不同的合格率,標準越高懦尝,質(zhì)量越好知纷,達標的就越少;合格率越高陵霉,那么達標的數(shù)據(jù)就越多琅轧。一般而言,當Q30>85%的時候踊挠,就說明數(shù)據(jù)質(zhì)量合格乍桂。還有一個是GC含量,一般在50%——60%之間效床。
一個給定堿基的測序質(zhì)量分值Q定義為下面的等式:
Q = -10log10(e)
其中睹酌,e為預計堿基檢出不正確的概率。
Q分值較高表示出錯的概率較小剩檀。
Q分值較低可能會導致相當大一部分的片段不可用憋沿,還可能導致假陽性的變異檢出增加,以致得出不準確的結(jié)論沪猴。
測量分值與堿基檢出精度的關(guān)系如下:
好吧辐啄,這一期我們就先講到這,下期再見运嗜。