1.將 gtf 文件下載好之后上傳到RStudio-Server史翘。
-
或者在自己的電腦上就直接讀取就行。
如圖所示我下載的是v43版本的基因組注釋文件必峰,現(xiàn)在最新版應(yīng)該已經(jīng)是v44了钻蹬。
2.進行讀取
經(jīng)過搜索教程,發(fā)現(xiàn)讀取gtf文件有一個專門的R包:rtracklayer
代碼如下:
library(rtracklayer)
gtf <- rtracklayer::import('./gencode.v43.annotation.gtf')
gtf <- as.data.frame(gtf)
gtf$seqnames %>% table()