說在前面:
早在 2009 年,韓斌團(tuán)隊(duì)(第一作者是黃學(xué)輝)就在 Genome Res 上發(fā)了一篇文章 High-throughput genotyping by whole-genome resequencing硫豆,提出通過對(duì)二代測序數(shù)據(jù)構(gòu)建 bin 標(biāo)記的方法進(jìn)行定位研究橙依,以降低測序誤差對(duì)定位的影響。
究其原因柿顶,是重測序數(shù)據(jù)和傳統(tǒng)的遺傳標(biāo)記有 2 點(diǎn)不同,1)由于測序數(shù)據(jù)基因組覆蓋率的問題,并不是群體內(nèi)所有個(gè)體在每個(gè)標(biāo)記都有位點(diǎn)信息梁呈;2)由于測序數(shù)據(jù)準(zhǔn)確性的問題,單個(gè)的 SNP 位點(diǎn)不再像過去的傳統(tǒng)標(biāo)記那么可靠蘸秘。所以它們提出了一種基于滑窗的方法將一個(gè) SNPs 集而不是單個(gè) SNP 作為一個(gè)標(biāo)記單位官卡。
本文的 SNPbinner 也是要解決這個(gè)問題,即:
Convert single nucleotide polymorphism (SNP) data into genomic bins.
原文引用:Gonda, I., H. Ashrafi, D.A. Lyon, S.R. Strickler, A.M. Hulse-Kemp, Q. Ma, H. Sun, K. Stoffel, A.F. Powell, S. Futrell, T.W. Thannhauser, Z. Fei, A.E. Van Deynze, L.A. Mueller, J.J. Giovannoni, and M.R. Foolad. 2019. Sequencing-based bin map construction of a tomato mapping population, facilitating high-resolution quantitative trait loci detection. Plant Genome 12:180010. doi:10.3835/plantgenome2018.02.0010
軟件主要包括三個(gè)選項(xiàng):分別為 crosspoints醋虏、bins寻咒、visualize孟辑。
1.?crosspoints
基于 SNPs 數(shù)據(jù)鑒定可能的 crossover points匙姜。
snpbinner? crosspoints? --input? PATH? ?--output PATH? ? (--min-length INT | --min-ratio FLOAT)? ? ? [optional args]?
--input? ? # 輸入文件
--output? ? # 輸出文件,分別展示了個(gè)體編號(hào)胡控、crosspoint 位置、crosspints 附近的基因型(染色體末端后為空白)叫挟。
??min?length? ? # crosspoints 之間的最小距離艰匙;
??min?ratio? ? ?# 同上,以比例為單位霞揉,如果是0.01旬薯,則為染色體 1% 的長度;
??cross?count? ? # 用于計(jì)算 transition 的可能性适秩,state transition probability 是這個(gè)值除以染色體長度绊序,默認(rèn)為 4;
??chrom?len? ? # 染色體長度秽荞,如果不指定骤公,則為最后一個(gè) SNPs 位點(diǎn);
??homogeneity? ? # 用于計(jì)算?emission 概率扬跋,默認(rèn)為 0.9阶捆;
2. bins
snpbinner bins --input PATH --output PATH --min-bin-size INT [--binmap-id ID]
輸入文件同上一部分的輸出文件;
輸出文件格式示例如下:
--min-bin-size? ?# 可以指定 bin 的最小長度钦听;
3.?visualize
可以對(duì)前面兩步的輸入和輸出文件做可視化處理洒试。比如:
snpbinner visualize --out PATH [--bins PATH]... [--crosspoints PATH]... [--snps PATH]...
直接在命令行指定輸入和輸出文件路徑即可。
此外朴上,我還寫了后續(xù)如果使用 R/qtl 進(jìn)行 QTL 定位分析垒棋,有興趣的可以移步:
R/qtl 定位分析(四)Non-normal phenotypes
安裝
如果 pip 無法直接安裝該軟件,可以按以下流程操作試試:
wget https://github.com/solgenomics/SNPbinner/archive/refs/tags/v1.0.0+GondaEtAl2019.tar.gz
tar -zxvf v1.0.0+GondaEtAl2019.tar.gz
cd SNPbinner-1.0.0-GondaEtAl2019
export PYTHONPATH=/your/own/path/lib/python2.7/site-packages/:$PYTHONPATH
python setup.py build
python setup.py install --prefix=/your/own/path
本著分享痪宰、交流的本意叼架,簡單做了筆記,如果有用衣撬,點(diǎn)個(gè)贊也是極好的乖订。