在上一步確定好候選區(qū)間后壳坪,需要找到候選區(qū)間內(nèi)的基因暇昂,即候選區(qū)間和參考基因組取交集莺戒,用到的工具是bedtools。
關(guān)于bedtools的詳細(xì)用法急波,推薦這篇文章从铲,介紹的很詳細(xì),需要的自瘸文骸:
https://www.jieandze1314.com/post/cnposts/151/
0.下載安裝
各版本的安裝包下載鏈接:https://github.com/arq5x/bedtools2/releases
$ tar xvf bedtools-2.25.0.tar.gz
# 進入目錄
$ cd /your/path/bedtools2
#安裝
$ make
bedtools現(xiàn)在不太好裝名段,推薦用conda解決阱扬。
1.準(zhǔn)備區(qū)間位置文件
11.GWAS:確定候選區(qū)間 - 簡書 (jianshu.com)
將上一步計算得到的候選基因區(qū)間整理為.pos文件,格式如下:
其中第一列為染色體伸辟,第二列為區(qū)間起始位置价认,第三列為區(qū)間終止位置。
candi_range.pos
2.對位置文件和gff文件進行排序
bedtools的輸入文件必須先進行排序再計算自娩,否則會報錯:
$ cd ~/bedtools2-2.25.0/bin
$ bedtools sort -chrThenSizeA -i candi_range.pos > candi_range_sort.pos
$ bedtools sort -chrThenSizeA -i genome.gff3 > genome_sort.gff3
3.在基因組范圍內(nèi)查找候選區(qū)間中的候選基因
$ ./bedtools intersect -a candi_range_sort.pos -b Cmo_sort.gff3 -wb > candi_gene.pos
查看結(jié)果:
candi_gene.pos
引用轉(zhuǎn)載請注明出處,如有錯誤敬請指出渠退。