需求
已知某基因組序列勾徽,染色體或scaffold ID順序不定,想要對(duì)其按數(shù)字排序统扳。
image.png
原順序:
image.png
想要的排序結(jié)果:
image.png
實(shí)現(xiàn)
使用bioawk,沒有的話conda直接安裝畅姊。
bioawk -c fastx '{print}' old.genome.fa | \
sort -k1,1V | awk '{print ">"$1;print $2}' >new.genome.fa