KneadData質(zhì)控苦锨、SortMeRNA去rRNA

導(dǎo)讀

宏轉(zhuǎn)錄組數(shù)據(jù)分析第一步。

一、KneadData下載逆屡、安裝、質(zhì)控

鏈接:https://bitbucket.org/biobakery/kneaddata/wiki/Home#markdown-header-installation

wget -c https://files.pythonhosted.org/packages/a4/6a/4176eee7a83b80ac12ca6727df6cb9dd3fec2051cca8a707ccbebc5962d3/kneaddata-0.7.3.tar.gz
# 下載
tar -zxvf kneaddata-0.7.3.tar.gz
# 解壓
rm kneaddata-0.7.3.tar.gz
# 刪除安裝包
python setup.py install
# 安裝依賴Trimmomatic和Bowtie2踱讨。使用"--bypass-dependencies-install"可取消魏蔗。

for i in `ls 1.rawdata`; do
    /[route]/kneaddata-0.7.3/kneaddata/knead_data.py \
-i 1.rawdata/$i/${i}_1.fq.gz \
-i 1.rawdata/$i/${i}_2.fq.gz \
-o result/qc/kneaddata \
-db /[route]/Databases/hg38 \
--trimmomatic /[route]/Trimmomatic-0.39 \
-t $threads \
--trimmomatic-options "SLIDINGWINDOW:4:20 MINLEN:50" \
--bowtie2-options "--very-sensitive --dovetail --al-gz" \
--remove-intermediate-output \
--run-fastqc-start \
--run-fastqc-end
done
# 質(zhì)控、去宿主

二痹筛、SortMeRNA安裝

鏈接:https://bioinfo.lifl.fr/RNA/sortmerna/

1 apt安裝

SortMeRNA version 2.0, 29/11/2014
一鍵下載莺治、安裝、apt安裝版本低不推薦

sudo apt install sortmerna
sortmerna --version

2 conda安裝

conda create -n python3.6 python=3.6
conda activate python3.6
conda config --show channels
conda install sortmerna
sortmerna --version
# SortMeRNA version 4.2.0
# Build Date: Mar 12 2020

三帚稠、建庫(kù)谣旁、去rRNA(only for version2)

version4以上直接用fasta序列,無(wú)需建庫(kù)滋早,非常的奈斯

wget -c http://bioinfo.lifl.fr/RNA/sortmerna/code/sortmerna-2.1-linux-64-multithread.tar.gz
# 在linux沒find到數(shù)據(jù)庫(kù)榄审,所以再下載一次,里面包含需要的數(shù)據(jù)庫(kù)杆麸。

indexdb_rna --ref \
./rRNA_databases/silva-bac-16s-id90.fasta,./index/silva-bac-16s-db:\
./rRNA_databases/silva-bac-23s-id98.fasta,./index/silva-bac-23s-db:\
./rRNA_databases/silva-arc-16s-id95.fasta,./index/silva-arc-16s-db:\
./rRNA_databases/silva-arc-23s-id98.fasta,./index/silva-arc-23s-db:\
./rRNA_databases/silva-euk-18s-id95.fasta,./index/silva-euk-18s-db:\
./rRNA_databases/silva-euk-28s-id98.fasta,./index/silva-euk-28s:\
./rRNA_databases/rfam-5s-database-id98.fasta,./index/rfam-5s-db:\
./rRNA_databases/rfam-5.8s-database-id98.fasta,./index/rfam-5.8s-db
# 建索引

# version 2 
for i in /[route]/*kneaddata_paired_[12].fastq; do
    base=${i##*/}
    head=${base%%_*}
    tail=${base#*kneaddata_}
sortmerna --ref /[route]/sortmerna-2.1b/rRNA_databases/silva-bac-16s-id90.fasta,/[route]/sortmerna-2.1b/index/silva-bac-16s-db:\
/[route]/sortmerna-2.1b/rRNA_databases/silva-bac-23s-id98.fasta,/[route]/sortmerna-2.1b/index/silva-bac-23s-db:\
/[route]/sortmerna-2.1b/rRNA_databases/silva-arc-16s-id95.fasta,/[route]/sortmerna-2.1b/index/silva-arc-16s-db:\
/[route]/sortmerna-2.1b/rRNA_databases/silva-arc-23s-id98.fasta,/[route]/sortmerna-2.1b/index/silva-arc-23s-db:\
/[route]/sortmerna-2.1b/rRNA_databases/silva-euk-18s-id95.fasta,/[route]/sortmerna-2.1b/index/silva-euk-18s-db:\
/[route]/sortmerna-2.1b/rRNA_databases/silva-euk-28s-id98.fasta,/[route]/sortmerna-2.1b/index/silva-euk-28s:\
/[route]/sortmerna-2.1b/rRNA_databases/rfam-5s-database-id98.fasta,/[route]/sortmerna-2.1b/index/rfam-5s-db:\
/[route]/sortmerna-2.1b/rRNA_databases/rfam-5.8s-database-id98.fasta,/[route]/sortmerna-2.1b/index/rfam-5.8s-db \
--reads $i \
--aligned result/qc/sortmerna/${head}_${tail}.rRNA \
--sam --num_alignments 1 --fastx -a $threads \
--other result/qc/sortmerna/${head}_${tail}.non.rRNA --log -v
done

四搁进、去rRNA(for newest version4)

# version4
route_db="/home/cheng/huty/softwares/sortmerna-2.1b/rRNA_databases"
route_index="/home/cheng/huty/softwares/sortmerna-2.1b/index"
threads=52

mkdir non_rrna
sortmerna \
--ref $route_db/silva-bac-16s-id90.fasta \
$route_db/silva-bac-23s-id98.fasta \
$route_db/silva-arc-16s-id95.fasta \
$route_db/silva-arc-23s-id98.fasta \
$route_db/silva-euk-18s-id95.fasta \
$route_db/silva-euk-28s-id98.fasta \
$route_db/rfam-5s-database-id98.fasta \
$route_db/rfam-5.8s-database-id98.fasta \
--reads CONT1_R1.fastq \
--reads CONT1_R2.fastq \
--fastx \
--paired_out \
--threads $threads \
-v \
--out2 \
--workdir run \
--other non_rrna/cont1

rm -r run  # 刪除中間文件
# 對(duì)kneaddata的結(jié)果進(jìn)行去RNA

參數(shù)
--fastx 【布爾】輸出fastq
--paired_out 【布爾】輸出配對(duì)結(jié)果
-v 【布爾】不羅嗦
--out2 【布爾】輸出結(jié)果文件為兩個(gè)
--workdir dir 中間文件輸出目錄
--other dir/prefix 輸出目錄和前綴

五、結(jié)果(for newest version4)

# 輸入文件
-rw-r--r-- 1 bayegy WST 13911342438 8月   4 11:00 CONT1_R1.fastq
-rw-r--r-- 1 bayegy WST 13911342438 8月   4 10:58 CONT1_R2.fastq

# 輸出文件
tree non_rrna/
non_rrna/
├── cont1_fwd.fastq
└── cont1_rev.fastq

-rw-rw-r-- 1 cheng WST 13903074018 8月  27 18:24 cont1_fwd.fastq
-rw-rw-r-- 1 cheng WST 13903074018 8月  27 18:24 cont1_rev.fastq

相關(guān)閱讀:宏轉(zhuǎn)錄組分析:SortMeRNA鑒定過濾rRNA

\color{green}{????原創(chuàng)文章昔头,碼字不易饼问,轉(zhuǎn)載請(qǐng)注明出處????}

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市揭斧,隨后出現(xiàn)的幾起案子莱革,更是在濱河造成了極大的恐慌,老刑警劉巖讹开,帶你破解...
    沈念sama閱讀 218,941評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件盅视,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡萧吠,警方通過查閱死者的電腦和手機(jī)左冬,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)纸型,“玉大人拇砰,你說我怎么就攤上這事≌纾” “怎么了除破?”我有些...
    開封第一講書人閱讀 165,345評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)琼腔。 經(jīng)常有香客問我瑰枫,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,851評(píng)論 1 295
  • 正文 為了忘掉前任光坝,我火速辦了婚禮尸诽,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘盯另。我一直安慰自己性含,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評(píng)論 6 392
  • 文/花漫 我一把揭開白布鸳惯。 她就那樣靜靜地躺著商蕴,像睡著了一般。 火紅的嫁衣襯著肌膚如雪芝发。 梳的紋絲不亂的頭發(fā)上绪商,一...
    開封第一講書人閱讀 51,688評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音辅鲸,去河邊找鬼格郁。 笑死,一個(gè)胖子當(dāng)著我的面吹牛瓢湃,可吹牛的內(nèi)容都是我干的理张。 我是一名探鬼主播,決...
    沈念sama閱讀 40,414評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼绵患,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼雾叭!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起落蝙,我...
    開封第一講書人閱讀 39,319評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤织狐,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后筏勒,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體移迫,經(jīng)...
    沈念sama閱讀 45,775評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年管行,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了厨埋。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,096評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡捐顷,死狀恐怖荡陷,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情迅涮,我是刑警寧澤废赞,帶...
    沈念sama閱讀 35,789評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站叮姑,受9級(jí)特大地震影響唉地,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評(píng)論 3 331
  • 文/蒙蒙 一耘沼、第九天 我趴在偏房一處隱蔽的房頂上張望极颓。 院中可真熱鬧,春花似錦群嗤、人聲如沸讼昆。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至闰围,卻和暖如春赃绊,著一層夾襖步出監(jiān)牢的瞬間酵颁,已是汗流浹背署恍。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評(píng)論 1 271
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留耗帕,地道東北人校仑。 一個(gè)月前我還...
    沈念sama閱讀 48,308評(píng)論 3 372
  • 正文 我出身青樓忠售,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親迄沫。 傳聞我的和親對(duì)象是個(gè)殘疾皇子稻扬,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評(píng)論 2 355