R 處理fastq數(shù)據(jù),簡單搜索后找到了Biostrings和ShortRead兩個包。
但是,如果想自己寫函數(shù)讀入fastq數(shù)據(jù)呢茂缚?我個人處理還是想將其讀入后處理為向量或者數(shù)據(jù)框。
if或者for循環(huán)會造成R處理過慢。剛想的思路如下:
- 按行讀入為向量x
- 對向量x的索引對4求余阱佛,構(gòu)造一個向量y帖汞。該向量與讀入數(shù)據(jù)等長,且內(nèi)容只有1凑术,2,3所意,0四個值淮逊。
- 對向量y的值,用邏輯值從向量x中可以拆分出4個向量扶踊。
- 拆分出的四個向量可以作為數(shù)據(jù)框的四列泄鹏,且其順序都是一一對應(yīng)。
可以避免直接出現(xiàn)if或者for秧耗,可能處理速度會快一些备籽。
就是簡單記錄個思路,有空再來實(shí)現(xiàn)(實(shí)現(xiàn)也不會出現(xiàn)在該平臺)分井。
沒用鏈接车猬,這次總不能鎖我了吧?