質控相關軟件
fastp
序列操作軟件
seqkit
NCBI 的 SRA toolkits
https://www.ncbi.nlm.nih.gov/sra/docs/toolkitsoft/
https://github.com/ncbi/sra-tools/wiki/HowTo:-fasterq-dump
查看文檔后,似乎需要注意兩點:
- 將中間目錄設置到SSD或者是RAM-disk將會極大地提升速度(其實這個本身就是一個IO密集的工作筹吐,必然如此)
- 多線程可以加速喉酌,但是過多的線程會導致錯誤的輸出啊片。在多線程或者多進程編程中页屠,總是會有這種結果贷揽,可以理解美澳。
總的來說竞阐,我覺得加速的關鍵,在于1 而不在于2