第一步:除掉 小于18bp 大于25bp 的序列 (參考其他文獻(xiàn)漆际,主要包括miRNA 和siRNA)
操作:conda 安裝?cutadapt? (啊啊啊啊台盯,不知道問什么刨摩,我的conda這么不好用校读,耗了很久胜卤。账月。综膀。)(鏈接:http://www.reibang.com/p/4ee2f4d2292f)
reads的過濾
--minimum-length LENGTHor-m LENGTH#根據(jù)最短長(zhǎng)度篩選reads;
--too-short-output FILE#為reads長(zhǎng)度最小值設(shè)定閾值篩選reads后,要丟棄的部分輸出到文件局齿;
--maximum-length LENGTHor-M LENGTH#根據(jù)最長(zhǎng)長(zhǎng)度篩選reads;
--too-long-output FILE#為reads長(zhǎng)度最大值設(shè)定閾值篩選reads后剧劝,要丟棄的部分輸出到文件;
--untrimmed-output FILE#將沒有adapter未做修剪的reads輸出到一個(gè)文件抓歼,而不是輸出到trimmed reads結(jié)果文件
--discard-trimmed#丟棄只有一個(gè)adapter的reads
--discard-trimmed等價(jià)于 --untrimmed-output /dev/null #丟棄沒有adapter的reads
作者:_eason_
鏈接:http://www.reibang.com/p/4ee2f4d2292f
來源:簡(jiǎn)書
簡(jiǎn)書著作權(quán)歸作者所有讥此,任何形式的轉(zhuǎn)載都請(qǐng)聯(lián)系作者獲得授權(quán)并注明出處。
我的代碼 :/baicai2/weiyx/....../cutadapt -m 18 -M 25?--too-short-output? short.file?--too-long-output long.file -o output.fa input.fa
#!/usr/bin/bash
for i in `cat name.txt`
do /baicai2/weiyx/anaconda2/bin/cutadapt -m 18 -M 25 --too-short-output $i.short --too-long-output $i.long -o $i.fa $i\_clean.fa
done