fasta序列條數(shù)統(tǒng)計(jì)
搜索>的數(shù)量
grep -c '^>' name.fasta
#seqkit統(tǒng)計(jì)提取
seqkit stats name.fasta -T | grep -v file | cut -f 4
# 統(tǒng)計(jì) 1-100bp 范圍長(zhǎng)的序列數(shù)
cat name.fasta | seqkit seq -m 1 -M 100 | seqkit stat -T | grep -v file | cut -f 4
fastq序列條數(shù)統(tǒng)計(jì)
# 通常以fastq.gz格式壓縮
zcat name.fastq.gz | awk 'NR%4==2{c++} END{print c}'
# 推薦下面的方法 pigz 會(huì)比gzip快10倍
pigz -dc name.fastq.gz | awk 'NR%4==2{c++} END{print c}'
# 如果不是壓縮格式
cat name.fastq | awk 'NR%4==2{c++} END{print c}'