https://www.biostars.org/p/302465/
https://www.biostars.org/p/297272/
啊啊啊啊啊啊?
選取唯一比對的序列uniqe read
nohup ls *sam | while read id; do samtools view -S -F 4 $id | grep -v "XS:" >${id%%%_*}.sam; done &
比對到miRNA base 上的reads 數(shù)目的統(tǒng)計炒嘲,沒有好辦法
我的理解是統(tǒng)計比對上的reads 的個數(shù)
所以月杉,我做的是宙地,統(tǒng)計sam 文件第三列遇汞,“比對的小RNA的名字”出現(xiàn)的個數(shù)。
ls *sam | while read id; do awk -F '\t' '{sum[$3]++}END{for(i in sum) print i "\t" sum[i]}' $id > ${id%%%.*}.counts; done &
出來的txt 文件類似于這樣:
補充:我不知道為啥熬甚,我的sam 文件除了頭部之外的列也以@開頭台诗,所以后面的流程就沒辦法進行热凹。解決辦法:
nohup ls *.sam | while read id; do sed -i "s/@HISEQ/HISEQ/g" $id; done &
得到的counts 文件合并
paste *mature.bna*counts > mature.bna.merge.counts