在剛接觸生信的時候氧猬,測到的第一套數(shù)據(jù)就發(fā)現(xiàn)有一定量的rRNA,那會就找了silva數(shù)據(jù)庫柳琢,經(jīng)過查看文檔绍妨,可以通過以下命令整理,得到泛植物的rRNA序列庫柬脸∷ィ可用于去除rRNA污染,或者評估
aria2c -j 20 https://www.arb-silva.de/fileadmin/silva_databases/release_132/Exports/SILVA_132_SSUParc_tax_silva_trunc.fasta.gz
aria2c -j 20 https://www.arb-silva.de/fileadmin/silva_databases/release_132/Exports/SILVA_132_LSUParc_tax_silva_trunc.fasta.gz
pigz -d *
cat *.fasta|perl -ne 'BEGIN{$id=q{};$seq=q{}}chomp;if(/^>/){print $id,qq{\n},$seq,qq{\n} if ($id=~/Eukaryota;Archaeplastida/);$id=$_;$seq=q{}}else{$seq.=$_;}END{print $id,qq{\n},$seq,qq{\n} if ($id=~/Eukaryota;Archaeplastida/)}'|perl -pe 'tr/U/T/ unless /^>/' > panPlant.rRNA.fa