前言
Sequencing depth and coverage: key considerations in genomic analyses.
現(xiàn)在接觸銷(xiāo)售人員進(jìn)行二代測(cè)序,掛在嘴邊的就是我們公司可以測(cè)多少X返吻,即使是做了一段時(shí)間的分析的我有時(shí)候還是會(huì)疑惑逮走,sequencing depth和covergae的區(qū)別是什么,正確的計(jì)算方法是什么重慢,不同的二代測(cè)序技術(shù)不同的動(dòng)物模型需要測(cè)多少X才合適饥臂。下面我就簡(jiǎn)單的記錄一下自己的學(xué)習(xí)記錄。
結(jié)論
現(xiàn)在大家喜歡直接看結(jié)果似踱,那我就直接拋出一個(gè)計(jì)算網(wǎng)站:
calculator
輸入讀段長(zhǎng)度擅笔,測(cè)序類(lèi)型和基因組大小,就可以根據(jù)讀段數(shù)計(jì)算深度
正文
Sequencing depth and coverage: key considerations in genomic analyses
這篇文章就是對(duì)這個(gè)問(wèn)題的一個(gè)詳細(xì)討論屯援,下面我給大家翻譯翻譯猛们。
首先看截圖,我們可以知道狞洋,測(cè)序深度的計(jì)算公式為LN/G弯淘,L就是讀段長(zhǎng)度,N是讀段數(shù)目吉懊,G是基因組大小庐橙。
舉例來(lái)說(shuō)假勿,人類(lèi)基因組3.1G,一個(gè)RNA-seq的reads數(shù)據(jù)為20M态鳖,數(shù)據(jù)為paired-end转培,讀長(zhǎng)150bp,那么測(cè)序深度就是20M2150/3.1G= 2 X
那我們?cè)賮?lái)討論一下sequencing depth 和 sequencing coverage的區(qū)別:
事實(shí)上沒(méi)有區(qū)別浆竭,若是真要講個(gè)說(shuō)法浸须,那就是coverage可以理解為檢測(cè)到全基因組的多少區(qū)域(百分比,最大值為100%)邦泄,但是sequencing covergae指的就是depth of sequencing coverage也就是sequencing depth删窒,反映了一個(gè)區(qū)域被平均多少個(gè)reads檢測(cè)到。
另外breadth of coverage需要區(qū)別一下顺囊,就是將全基因組大小換成target region作為分母計(jì)算上面那個(gè)公司肌索,
以下為高通量測(cè)序數(shù)據(jù)處理系列快速通道:
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(零):NGS分析如何選擇合適的參考基因組和注釋文件
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(一):比對(duì)軟件STAR的使用
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(二):Read Counts的提取
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(三):Pathway Analysis及GSEA
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(四):DeepTools學(xué)習(xí)筆記
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(五):上傳二代測(cè)序數(shù)據(jù)到GEO
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(六):什么是測(cè)序深度和測(cè)序覆蓋度?
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(七):使用ChIPQC包檢查ChIP-seq的質(zhì)量