PIBLUP:一款高效處理動植物基因組大數(shù)據(jù)的GS軟件
近期脊阴,中國農(nóng)業(yè)大學(xué)劉劍鋒老師課題組握侧,在Frontiers in Genetics(IF:4.151)雜志上發(fā)表了一篇名為“PIBLUP: High-Performance Software for Large-Scale Genetic Evaluation of Animals and Plants”的文章,介紹他們課題組開發(fā)的基因組選擇軟件PIBLUP嘿期。文章鏈接:https://www.frontiersin.org/articles/10.3389/fgene.2018.00226/full?&utm_source=Email_to_authors_&utm_medium=Email&utm_content=T1_11.5e1_author&utm_campaign=Email_publication&field=&journalName=Frontiers_in_Genetics&id=330475
關(guān)鍵詞:
高效處理:運算速度快品擎,性能優(yōu)越
多線程,并行運算:處理基因組大數(shù)據(jù)和復(fù)雜模型
功能強大的GS軟件:可以構(gòu)建和利用A矩陣备徐,G矩陣和H矩陣萄传,加性矩陣,顯性矩陣和上位性矩陣蜜猾,可以計算ABLUP秀菱,GBLUP和SSBLUP
國內(nèi)首款可以處理縱向數(shù)據(jù)的遺傳評估軟件: 可以處理面板數(shù)據(jù)和縱向數(shù)據(jù),測定日模型和隨機(jī)回歸模型
操作友好:定義模型簡單蹭睡,操作簡單衍菱,支持字符串編號
PIBLUP軟件利用的技術(shù):
1,PCG棠笑,預(yù)處理共軛梯度法
預(yù)處理共軛梯度法(preconditioned conjugate gradientmethod梦碗,PCG)是一種求解方程組的迭代方法禽绪,具有快速收斂蓖救、存儲量小洪规、不必預(yù)先估計參數(shù)等特點,近年來在求解大型稀疏方程組中取得了較好的成效循捺。預(yù)處理共軛梯度法對系數(shù)矩陣作預(yù)處理斩例,以加速迭代收斂速度。
2从橘,IOD念赶,數(shù)據(jù)迭代方法
數(shù)據(jù)迭代方法(iteration on data, IOD),研究表明恰力,使用預(yù)處理共軛梯度(PCG)進(jìn)行數(shù)據(jù)迭代(IOD)是高效求解混合線性方程組(MME)的方法叉谜。
3,MKL踩萎,Intel數(shù)學(xué)核心函數(shù)庫
Intel數(shù)學(xué)核心函數(shù)庫(MKL)是一套高度優(yōu)化后的數(shù)學(xué)函數(shù)停局,面向高性能工程和科學(xué)應(yīng)用。英特爾 MKL 的集群版本包括 ScaLAPACK 與分布式內(nèi)存快速傅立葉轉(zhuǎn)換香府,并提供了線性代數(shù) (BLAS董栽、LAPACK 和Sparse Solver)、快速傅立葉轉(zhuǎn)換企孩、矢量數(shù)學(xué) (Vector Math) 與隨機(jī)號碼生成器支持锭碳。MKL下載地址:https://software.intel.com/en-us/mkl。
4勿璃,MPI擒抛,消息傳遞接口
MPI全稱消息傳遞接口,是Message Passing Interface的縮寫蝗柔,主要用于高性能并行計算闻葵。MPI下載地址:https://www.mpich.org/downloads/。
PIBLUP功能介紹
根據(jù)PIBLUP使用指南介紹癣丧,PIBLUP具有以下功能:
1槽畔,單性狀動物模型,靈活定義固定因子胁编,隨機(jī)因子厢钧,可以使用系譜和基因組數(shù)據(jù)
2,多性狀動物模型嬉橙,靈活定義固定因子早直,隨機(jī)因子,可以使用系譜和基因組數(shù)據(jù)
3市框,根據(jù)基因組信息構(gòu)建G加性矩陣霞扬,構(gòu)建顯性矩陣和上位性矩陣并估算其效應(yīng)值
4,單性狀隨機(jī)回歸模型,可以使用系譜和基因組數(shù)據(jù)
5喻圃,多性狀隨機(jī)回歸模型萤彩,可以使用系譜和基因組數(shù)據(jù)
6,根據(jù)系譜和基因組數(shù)據(jù)斧拍,靈活構(gòu)建H矩陣雀扶,設(shè)置a,b,tau和omega等參數(shù)
結(jié)果比較:PIBLUP VS DMU
使用PIBLUP和DMU分析同一數(shù)據(jù)集,計算GEBV的結(jié)果肆汹,兩者的相關(guān)系數(shù)為1愚墓,表明兩者結(jié)果完全一致。
速度比較:PIBLUP VS DMU and BLUPF90
文章中比較了PIBLUP昂勉,BLUPF90和DMU在單線程和多線程對同一數(shù)據(jù)的運行結(jié)果浪册,結(jié)果如下:
結(jié)果表明, 在單線程時岗照,PIBLUP運行51.49分鐘议经,BLUPF90運行84.97分鐘,DMU運行了58.18分鐘谴返,PIBLUP運行時間最短煞肾。在四線程時,PIBLUP運行了17.61分鐘嗓袱,BLUPF90運行了49.87分鐘籍救,DMU運行了38.79分鐘,PIBLUP優(yōu)勢明顯渠抹。
軟件參數(shù)文件比較:
下面使用DMU和PIBLUP的參數(shù)文件蝙昙,比較兩者在個體動物模型和一步法SSBLUP的使用方法。
1梧却,個體動物模型
模型:
觀測值:y
固定因子:sex奇颠,birth_mon, birth_weight
隨機(jī)因子:加性效應(yīng)a
DMU參數(shù)文件
PIBLUP參數(shù)文件
2放航,一步法SSBLUP
模型:
觀測值:y
固定因子:beta固定回歸系數(shù)
隨機(jī)因子:a加性環(huán)境效應(yīng)烈拒,pe永久環(huán)境效應(yīng)
DMU參數(shù)文件
PIBLUP參數(shù)文件
H矩陣參數(shù)設(shè)置說明:
可以看出, 相對于DMU广鳍,PIBLUP操作更簡單方便荆几,語法更接近于模型語法書寫。
PIBLUP軟件特色:
1赊时,PIBLUP軟件結(jié)合最新的算法吨铸,支持并行計算,運算速度快祖秒,符合大數(shù)據(jù)時代的需求
2诞吱,PIBLUP既可用于傳統(tǒng)動物模型舟奠,又可用于GBLUP和SSBLUP的計算,而且內(nèi)置G矩陣和H矩陣構(gòu)建函數(shù)房维,友好方便
3鸭栖,隨機(jī)回歸模型是動物遺傳評估中比較復(fù)雜的模型,可以用于多次觀測的性狀握巢,比如雞不同時間的產(chǎn)蛋量,豬的生長速度和飼料消耗松却,牛的不同測定日的產(chǎn)奶量等暴浦。PIBLUP分析隨機(jī)回歸模型,可以結(jié)合G矩陣和H矩陣晓锻,功能強大
4歌焦,擁有自主產(chǎn)權(quán),是國內(nèi)首款既可以分析傳統(tǒng)動物模型砚哆,又可以分析GBLUP和SSBLUP独撇,還可以結(jié)合隨機(jī)回歸模型的全基因組選擇軟件
PIBLUP版本介紹
PIBLUP分為科研版(個體數(shù)有限制,不超過2000)和商用版(無限制)躁锁。
科研版免費使用纷铣。商用版需要聯(lián)系作者授權(quán)。
科研版PIBLUP下載地址
PIBLUP軟件托管在Github战转,下載地址:https://github.com/huiminkang/PIBLUP](https://github.com/huiminkang/PIBLUP
PIBLUP使用指南
PIBLUP使用指南下載地址:https://github.com/huiminkang/PIBLUP/blob/master/User%20manual%20for%20PIBLUP.pdf