OmegaPlus?是一個用于檢測基因組數(shù)據(jù)中正選擇痕跡的生物信息學(xué)工具萧求∪糇ǎ基于單倍型頻率分布和重組事件檢測選擇信號,通過計算ω統(tǒng)計量(omega statistic)來識別選擇位點(diǎn)丙挽。
官方軟件提供了幾種不同的版本:
OmegaPlus:順序版本毕谴;
OmegaPlus-F:細(xì)粒度并行版本,適合在在更小的任務(wù)單位上并行化庭惜;
OmegaPlus-C:粗粒度并行版本,在較大的任務(wù)塊上分配工作穗酥,適合任務(wù)量較大的計算場景护赊;
OmegaPlus-M:多粒度并行版本結(jié)合了細(xì)粒度和粗粒度的優(yōu)點(diǎn),通常在實(shí)際計算中性能表現(xiàn)最佳砾跃。
示例:
./OmegaPlus-M -name TEST -input TEST.fasta -minwin 100 -maxwin 1000 -grid 10000 -threads 4
-name: 設(shè)置輸出文件的前綴骏啰,用于標(biāo)記結(jié)果文件。
-input: 指定輸入文件(例如基因組序列文件)抽高。
-minwin 和 -maxwin: 設(shè)置掃描窗口的范圍判耕。
-grid: 決定基因組上劃分的網(wǎng)格數(shù)量,值越大分辨率越高翘骂,但計算量也越大壁熄。
-threads: 指定線程數(shù)量(僅用于并行版本)
其它可選參數(shù):
-name <STRING>
指定運(yùn)行名稱帚豪,生成的輸出文件將以該名稱作為前綴。
-input <STRING>
輸入對齊文件的名稱草丧。
-grid <INTEGER>
指定在對齊中計算 omega 值的網(wǎng)格數(shù)狸臣,數(shù)值越大分辨率越高,但計算量更大昌执。
-minwin <INTEGER>/-maxwin <INTEGER>
設(shè)置用于計算 SNPs 之間連鎖不平衡值的最小和最大窗口大小烛亦。
-length <INTEGER>
指定對齊長度,僅適用于 MS-like 和 MaCS-like 輸入文件懂拾。
-impute <N or GAP>
啟用對N或GAP符號的隨機(jī)插補(bǔ)煤禽,將它們轉(zhuǎn)換為有效字符。
可以使用兩次-impute分別處理N和GAP岖赋。
示例:-impute N -impute GAP檬果。
-seed <INTEGER>
指定隨機(jī)數(shù)種子,用于插補(bǔ)N和GAP符號贾节,或?qū)?DNA 對齊轉(zhuǎn)化為二進(jìn)制數(shù)據(jù)汁汗。
必須與-impute和-binary一起使用。
-binary
將 DNA 對齊數(shù)據(jù)轉(zhuǎn)換為二進(jìn)制格式栗涂。
-threads <INTEGER>
指定線程數(shù)知牌,僅適用于并行版本 OmegaPlus-F、OmegaPlus-C 和 OmegaPlus-M斤程。
-minsnps <INTEGER>
指定子區(qū)域內(nèi)計算 omega 值的最小 SNP 數(shù)量角寸。
示例:-minsnps 10。
-ld <STRING>
指定連鎖不平衡的測量類型忿墅,支持以下選項:
????RSQUARE(默認(rèn)): SNPs 之間的相關(guān)系數(shù) r2扁藕。
????D: D 統(tǒng)計量。
????ABSD: D 的絕對值疚脐。
????DOM: D_omega 統(tǒng)計量亿柑。
????ABSDOM: D_omega 的絕對值。
????ABSDOM2: D_omega 的絕對值棍弄,按頻率乘積歸一化望薄。
示例:-ld RSQUARE。
-maf <FLOAT>
排除次等位基因頻率低于閾值的 SNP呼畸。
-no-singletons
從分析中排除單一出現(xiàn)的 SNPs痕支。
-b <INTEGER>
允許每個位置在左、右窗口中 SNPs 數(shù)目差異不超過<INTEGER>蛮原,實(shí)現(xiàn)對最佳 omega 值的近似搜索卧须。
-all
輸出文件中顯示更多結(jié)果信息。
-reports
為每個對齊生成單獨(dú)的報告文件。
-sampleList <STRING>
用于 VCF 文件花嘶,指定需要包含的樣本笋籽。
-sampleList_out <STRING>
為輸入 VCF 文件生成樣本列表。
-mbs
指定輸入文件為 mbs 格式(將按 ms 格式處理)察绷。
-noSeparator
禁止在輸出中打印//分隔符干签,便于元處理(如在 R 中處理結(jié)果)。
案例: