一、在NCBI上下載rRNA的fasta序列,用于建立索引
1.參考:https://ucdavis-bioinformatics-training.github.io/2017-June-RNA-Seq-Workshop/wednesday/contamination.html
2.下載步驟
2.1?打開NCBI,select “Taxonomy” and search for “Homo sapiens“
2.2 點擊?Homo sapiens
2.3?再點一次
2.4?右邊表格Click on the “Subtree links” for Nucleotide:
2.5?左邊選擇rRNA
2.6?下載FASTA?數(shù)據(jù)
注意:選擇顯示兩百個尔破,讓所有記錄都放在一頁航夺,以便下載全部的條目
另存為:
hg38_rRNA.fasta
二、bowtie2建立rRNA索引
1.解壓 hg38_rRNA.fa.gz
2.?建立索引(index)命令:bowtie2-build hg38_rRNA.fa hg38_rRNA
三万牺、利用bowtie2去除rRNA
1.針對單端測序文件(single-end)
命令:?bowtie2 -x ~/RNASEQ/index/rRNA_index/hg38_rRNA --un-gz ${i}_IP_rmrRNA.fastq.gz -U ${i}_IP.read1_Clean.fastq.gz -p 8 -S ${i}_rRNA.sam; rm ${i}_rRNA.sam
2.針對雙端測序文件(paired-end)
命令:bowtie2 -x ~/RNASEQ/index/rRNA_index/hg38_rRNA --un-conc-gz ${i}_input_rmrRNA.fastq.gz (會生成.1、.2后綴的兩個雙端文件洽腺,就是去除了rRNA的fastq) -1 ${i}_in.read1_Clean.fastq.gz -2 ${i}_in.read2_Clean.fastq.gz -p 8 -S ${i}_rRNA.sam; rm ${i}_rRNA.sam;?