我的ChIP-Seq(1): FastQC報告解讀

新手,剛做完一個ChIP-Seq項目的分析,來記錄一下单芜,會分好幾篇。

首先是下機數(shù)據(jù)fastqc之后會生成一個html格式的報告枚冗,根據(jù)報告可以看出自己數(shù)據(jù)的特點缓溅,便于之后clean的參數(shù)設(shè)置。以下是fastqc(v0.11.5)報告的內(nèi)容說明(以自己的數(shù)據(jù)為例赁温,經(jīng)公司粗過濾后的下機數(shù)據(jù))有網(wǎng)上搜索到的也有自己的體會:

basic?statistics:

基本信息

Per base sequence quality:

堿基質(zhì)量坛怪,F(xiàn)red值=-10*log10(p);p為某堿基測錯的概率股囊,若quality是20則概率為0.01袜匿,一般集中在30-40;如圖橫軸代表位置稚疹,縱軸quality居灯。紅線表示中位數(shù),藍線是平均數(shù)内狗,觸須是10%-90%區(qū)間怪嫌,黃色是25%-75%區(qū)間(此圖沒有);若任一位置的下四分位數(shù)低于10或中位數(shù)低于25柳沙,報"WARN"岩灭;若任一位置的下四分位數(shù)低于5或中位數(shù)低于20,報"FAIL".

Per?tile Sequence Quality:

橫軸是位置赂鲤,縱軸是tile的index編號噪径,熱圖顏色淺代表質(zhì)量低柱恤。當某些tile出現(xiàn)暖色時,后續(xù)分析應(yīng)把該tail測序結(jié)果全部去除找爱。

這一模塊是檢查reads中每一個堿基位置在不同的測序小孔之間的偏離度梗顺,藍色表示低于平均偏離度,越紅則說明偏離平均質(zhì)量方差越多车摄,也就是說質(zhì)量越差寺谤。如果出現(xiàn)質(zhì)量問題可能是短暫的,如有氣泡產(chǎn)生练般,也可能是長期的矗漾,如在某一小孔中存在殘骸。問題不大薄料。

per?sequence?quality?scores:

橫軸是質(zhì)量Q值敞贡,縱軸是對應(yīng)的reads數(shù)目。主要集中在高分摄职,證明測序質(zhì)量好誊役。

Per Base Sequence Content:

所有reads每一個位置的堿基分布」仁校縱軸為百分比蛔垢。ATCG出現(xiàn)的頻率應(yīng)該接近,且沒有位置差異迫悠,四條線應(yīng)該平行且接近鹏漆。當部分位置堿基的比例出現(xiàn)bias時,往往是有overrepresented sequence的污染创泄。當所有位置的堿基比例一致的表現(xiàn)出bias時艺玲,即四條線平行但分開,往往代表文庫有bias (建庫過程或本身特點)鞠抑,或者是測序中的系統(tǒng)誤差饭聚。 當任一位置的A/T比例與G/C比例相差超過10%,報"WARN"搁拙;當任一位置的A/T比例與G/C比例相差超過20%秒梳,報"FAIL"。

per?sequence GCcontent:

紅色是實際值箕速,若出現(xiàn)雙峰酪碘,則是混入了其它DNA。

per?base N?content:

測序儀不能分辨的堿基為N盐茎,若超過5%則WARN婆跑,超過20%則FAIL。

sequence?length?distribution:

理論上每次測序儀測出的read長度一致庭呜,但由于建庫等因素通常會導(dǎo)致一些小片段滑进,如果報FAIL,表明此次測序過程中產(chǎn)生的數(shù)據(jù)不可信募谎。未過濾之前如圖一扶关,clean之后會出現(xiàn)圖二,越短的reads越少数冬,不會正態(tài)分布节槐。

圖一
圖二

sequence?duplication?levels:

序列完全一致的reads的頻率。橫軸表示重復(fù)的次數(shù)拐纱,縱軸表示重復(fù)的reads的數(shù)目( 以unique reads的總數(shù)作為100%)铜异。一般測序深度越高,越容易產(chǎn)生一定程度的重復(fù)序列秸架。但是read越長越不容易完全重復(fù)(測序錯誤揍庄、偏差等原因),所以重復(fù)程度可能是低估的东抹。

overrepresented?sequences:

No蚂子。指有某個序列大量出現(xiàn)(fastqc的標準是0.1%以上)一般有在前面GC圖能看出來。

adapter?content:

橫軸表示堿基位置缭黔,縱軸表示百分比食茎。當fastqc分析時沒有選擇參數(shù)-a adapter list時,默認使用圖例中的4種通用adapter序列進行統(tǒng)計馏谨。若有adapter殘留别渔,后續(xù)必須去接頭。

Kmer?content:

某k個bp的短序列在reads中大量出現(xiàn)惧互。fastqc默認的k=5哎媚,可以通過-k --?kmers參數(shù)更改,范圍是2-10壹哺。出現(xiàn)圖一這種情況的原因要么是序列本身重復(fù)度高抄伍,比如建庫PCR的時候出現(xiàn)了Bias」芟或者adapter沒有除干凈截珍。clean之后前幾個堿基還有少數(shù)高頻也沒關(guān)系,不影響后續(xù)分析箩朴,可正常使用岗喉。

圖一
圖二

以上。

可以看出我這批數(shù)據(jù)質(zhì)量還是很好的炸庞,其實可以直接比對钱床,已經(jīng)是公司粗過濾之后的。但是我選擇了自己再過濾一遍埠居,下一個筆記會講查牌。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末事期,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子纸颜,更是在濱河造成了極大的恐慌兽泣,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,080評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件胁孙,死亡現(xiàn)場離奇詭異唠倦,居然都是意外死亡,警方通過查閱死者的電腦和手機涮较,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,422評論 3 385
  • 文/潘曉璐 我一進店門稠鼻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人狂票,你說我怎么就攤上這事候齿。” “怎么了苫亦?”我有些...
    開封第一講書人閱讀 157,630評論 0 348
  • 文/不壞的土叔 我叫張陵毛肋,是天一觀的道長。 經(jīng)常有香客問我屋剑,道長润匙,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,554評論 1 284
  • 正文 為了忘掉前任唉匾,我火速辦了婚禮孕讳,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘巍膘。我一直安慰自己厂财,他們只是感情好,可當我...
    茶點故事閱讀 65,662評論 6 386
  • 文/花漫 我一把揭開白布峡懈。 她就那樣靜靜地躺著璃饱,像睡著了一般。 火紅的嫁衣襯著肌膚如雪肪康。 梳的紋絲不亂的頭發(fā)上荚恶,一...
    開封第一講書人閱讀 49,856評論 1 290
  • 那天,我揣著相機與錄音磷支,去河邊找鬼谒撼。 笑死,一個胖子當著我的面吹牛雾狈,可吹牛的內(nèi)容都是我干的廓潜。 我是一名探鬼主播,決...
    沈念sama閱讀 39,014評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼辩蛋!你這毒婦竟也來了呻畸?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,752評論 0 268
  • 序言:老撾萬榮一對情侶失蹤堪澎,失蹤者是張志新(化名)和其女友劉穎擂错,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體樱蛤,經(jīng)...
    沈念sama閱讀 44,212評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,541評論 2 327
  • 正文 我和宋清朗相戀三年剑鞍,在試婚紗的時候發(fā)現(xiàn)自己被綠了昨凡。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,687評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡蚁署,死狀恐怖便脊,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情光戈,我是刑警寧澤哪痰,帶...
    沈念sama閱讀 34,347評論 4 331
  • 正文 年R本政府宣布,位于F島的核電站久妆,受9級特大地震影響晌杰,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜筷弦,卻給世界環(huán)境...
    茶點故事閱讀 39,973評論 3 315
  • 文/蒙蒙 一肋演、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧烂琴,春花似錦爹殊、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,777評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽捧请。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間殖熟,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,006評論 1 266
  • 我被黑心中介騙來泰國打工荒澡, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留橡淆,地道東北人。 一個月前我還...
    沈念sama閱讀 46,406評論 2 360
  • 正文 我出身青樓父虑,卻偏偏與公主長得像该酗,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,576評論 2 349

推薦閱讀更多精彩內(nèi)容