2019-12-20 學(xué)習(xí)記錄3

質(zhì)控

trimmomatic 去接頭

Trimmomatic工具是用于illumina二代測序數(shù)據(jù)的reads處理伟恶,主要對接頭(adapter)序列和低質(zhì)量序列進(jìn)行過濾颅筋。
一般的質(zhì)控軟件在處理含有接頭序列的 reads 時,通常采用 "在允許錯配的情況下乎婿,如果分析的 read 匹配一定數(shù)量的接頭序列即去除這條 read 或從匹配開始的位置截斷 read,僅保留匹配位置之前的部分序列" 的方式。
如果采取 "去除含有接頭序列的 reads" 的方式夺刑,會造成測序數(shù)據(jù)的浪費 (如果片段選擇沒有控制好,整個 lane 會有很大一部分?jǐn)?shù)據(jù)含有接頭序列分别,怎么辦遍愿?);
如果采取 "從匹配開始的位置截斷 read,僅保留匹配位置之前的部分序列" 的方式耘斩,對于只含有少數(shù)幾個堿基的 reads沼填,普通的質(zhì)控軟件是處理不了的(又該怎么辦?)括授。
But坞笙,Trimmomatic 有兩種模式:Single End Mode 和 Paired End Mode轧邪,對于單端測序數(shù)據(jù),它和其它軟件相比沒有明顯的優(yōu)勢羞海;但如果是雙端測序的數(shù)據(jù)忌愚,Trimmomatic 采用兩種去接頭方式,更強大却邓,更徹底硕糊!
普通模式:匹配一定數(shù)量的接頭序列即截斷序列,保留匹配起始位置之前的序列腊徙,如下圖中A简十、B 所示: A、如果從 reads 的開始就匹配到接頭序列的話撬腾,整條 reads 會被去除螟蝙; B、如果是從 reads 的其它部分匹配到接頭序列民傻,則從匹配的位置截斷序列胰默,保留包含接頭的部分。
超級強大的回文模式漓踢,如上圖 C和 D 所示:想要了解回文模式去接頭的原理牵署,我們需要先熟悉一下:測序結(jié)果中的接頭序列來自哪里筐喳? 由于只有當(dāng)插入片段的長度小于測序的讀長時才會在測序結(jié)果中出現(xiàn)接頭序列站宗。那么對于含有接頭的片段,正反向的 reads 在除接頭之外的部分應(yīng)該是反向互補的均抽。因此挺据,對于雙端測序數(shù)據(jù)的處理上取具,Trimmomatic 在考慮接頭匹配情況的同時也檢查正反向 reads 的序列,從而更加有效的去掉接頭序列扁耐。理論上暇检,即使 read 僅含有 1 個堿基的接頭序列,這 1 個堿基也能被切除做葵!

原理

in/output

java -jar Trimmomatic/trimmomatic-0.35.jar PE -threads 10 -trimlog 01_cleandata/${infile}/${infile}.logfile 
/Rawdata/${infile}/${infile}_R1.fq.gz /Rawdata/${infile}/${infile}_R2.fq.gz 
01_cleandata/${infile}/${infile}_clean_R1.fq 01_cleandata/${infile}/${infile}_clean_unpaired_R1.fq 
01_cleandata/${infile}/${infile}_clean_R2.fq 01_cleandata/${infile}/${infile}_clean_unpaired_R2.fq  
ILLUMINACLIP:/mnt/raid1/data/Software/Trimmomatic/adapters/TruSeq2-PE.fa:2:30:10  SLIDINGWINDOW:15:30 MINLEN:110 TRAILING:30 AVGQUAL:30

PE 設(shè)置使用trimmomatic處理雙端數(shù)據(jù)占哟,單端數(shù)據(jù)用(‘SE’)
-thread 16 設(shè)置線程數(shù)為16
-phred33 設(shè)置堿基的質(zhì)量格式(默認(rèn)-phred64,自v0.32版本之后可自動識別是phred33還是phred64)
-trimlog trim.log 設(shè)置trimmommatic工具處理的日志文件為’trim.log’酿矢,每兩行為一對reads信息
ILLUMINACLIP:"adapter"/Exome.fa:2:30:9:1:TRUE榨乎,這部分指定2種去接頭模式的參數(shù):"adapter"/Exome.fa:2:30:9:1:TRUE,這部分指定2種去接頭模式的參數(shù):"adapter"/Exome.fa 指明需要匹配的接頭文件瘫筐,2 代表 16 個堿基長度的種子序列中可以有 2 個錯配蜜暑,30 代表采用回文模式時匹配得分至少為30 (約50個堿基),10 代表采用簡單模式時匹配得分至少為10 (約17 個堿基)策肝;
LEADING:20肛捍,從序列的開頭開始去掉質(zhì)量值小于 20 的堿基隐绵;
TRAILING:20,從序列的末尾開始去掉質(zhì)量值小于 20 的堿基拙毫;
SLIDINGWINDOW:4:15依许,從 5' 端開始以 4 bp 的窗口計算堿基平均質(zhì)量,如果此平均值低于 15缀蹄,則從這個位置截斷 read峭跳;
MINLEN:36, 如果 reads 長度小于 36 bp 則扔掉整條 read缺前。

下載

wget http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.38.zip
unzip Trimmomatic-0.38.zip 
java -jar~/biosoft/Trimmomatic/Trimmomatic-0.36/trimmomatic-0.36.jar –h

高通量測序數(shù)據(jù)質(zhì)控神器—Trimmomatic
學(xué)習(xí)使用一款數(shù)據(jù)質(zhì)控軟件(Trimmomatic)
測序數(shù)據(jù)質(zhì)控界的寵兒-Trimmomatic

fastqc

fastqc -o output dir -f fastq|bam|sam seqfile1 .. seqfileN

fastQC

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末蛀醉,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子衅码,更是在濱河造成了極大的恐慌拯刁,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,122評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件逝段,死亡現(xiàn)場離奇詭異垛玻,居然都是意外死亡,警方通過查閱死者的電腦和手機惹恃,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評論 3 395
  • 文/潘曉璐 我一進(jìn)店門夭谤,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人巫糙,你說我怎么就攤上這事〖粘耍” “怎么了参淹?”我有些...
    開封第一講書人閱讀 164,491評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長乏悄。 經(jīng)常有香客問我浙值,道長,這世上最難降的妖魔是什么檩小? 我笑而不...
    開封第一講書人閱讀 58,636評論 1 293
  • 正文 為了忘掉前任开呐,我火速辦了婚禮,結(jié)果婚禮上规求,老公的妹妹穿的比我還像新娘筐付。我一直安慰自己,他們只是感情好阻肿,可當(dāng)我...
    茶點故事閱讀 67,676評論 6 392
  • 文/花漫 我一把揭開白布瓦戚。 她就那樣靜靜地躺著,像睡著了一般丛塌。 火紅的嫁衣襯著肌膚如雪较解。 梳的紋絲不亂的頭發(fā)上畜疾,一...
    開封第一講書人閱讀 51,541評論 1 305
  • 那天,我揣著相機與錄音印衔,去河邊找鬼啡捶。 笑死,一個胖子當(dāng)著我的面吹牛奸焙,可吹牛的內(nèi)容都是我干的瞎暑。 我是一名探鬼主播,決...
    沈念sama閱讀 40,292評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼忿偷,長吁一口氣:“原來是場噩夢啊……” “哼金顿!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起鲤桥,我...
    開封第一講書人閱讀 39,211評論 0 276
  • 序言:老撾萬榮一對情侶失蹤揍拆,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后茶凳,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體嫂拴,經(jīng)...
    沈念sama閱讀 45,655評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,846評論 3 336
  • 正文 我和宋清朗相戀三年贮喧,在試婚紗的時候發(fā)現(xiàn)自己被綠了筒狠。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,965評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡箱沦,死狀恐怖辩恼,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情谓形,我是刑警寧澤灶伊,帶...
    沈念sama閱讀 35,684評論 5 347
  • 正文 年R本政府宣布,位于F島的核電站寒跳,受9級特大地震影響聘萨,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜童太,卻給世界環(huán)境...
    茶點故事閱讀 41,295評論 3 329
  • 文/蒙蒙 一米辐、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧书释,春花似錦翘贮、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至检激,卻和暖如春肴捉,著一層夾襖步出監(jiān)牢的瞬間腹侣,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評論 1 269
  • 我被黑心中介騙來泰國打工齿穗, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留傲隶,地道東北人。 一個月前我還...
    沈念sama閱讀 48,126評論 3 370
  • 正文 我出身青樓窃页,卻偏偏與公主長得像跺株,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子脖卖,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,914評論 2 355

推薦閱讀更多精彩內(nèi)容