Hello亲族,我是倚劍聽雨可缚,每日隨手更新~帶你看生信小白的日常!
如果你也打算在 hg19的 GTF 文件里添加 tRNA和 rRNA 的數(shù)據(jù)帘靡。
首先,tRNA 數(shù)據(jù)可以在GENCODE的 GRCh38.p10版本中下載Predicted tRNA genes杏慰。
其次炼鞠,rRNA 的5s 5.8s 28s 18s 來自https://en.wikipedia.org/wiki/Ribosomal_RNA的前四個Reference。
使用 cat 命令可以合并兩個 GTF 文件
cat A B > C
不過 GTF 往往必須經(jīng)過排序才可以使用谒主。比對hg19的 GTF發(fā)現(xiàn)其 GTF 格式先按照染色體排序,然后相同的染色體又對 Start position霎肯,也就是第四列進(jìn)行排序。
通過使用sort配合awk可以簡單的實現(xiàn)對 GTF 文件的排序观游。下面是我的代碼
cat A.gtf | awk -F '\t' -v OFS=',' '{$1=$1;print}' | sort -t, -k1,1 -k4,5n | awk -F ',' -v OFS='\t' '{$1=$1;print}' > A.sorted.gtf &
注意:請確保你的 GTF 文件是 tab 鍵分隔,否則請改變 awk 的分隔符參數(shù)-F
轉(zhuǎn)載請注明出處懂缕,違者必究允跑。