基因組選擇常見(jiàn)問(wèn)題FAQ
文獻(xiàn): FAQ for genomic selection
這是一篇文獻(xiàn), 介紹GS常見(jiàn)的問(wèn)題, 翻譯并學(xué)習(xí).
1, 我聽(tīng)說(shuō)如果有1000個(gè)動(dòng)物的基因型和表型值, 就可以進(jìn)行全基因組選擇, 并且準(zhǔn)確性可以保持很多代, 這是真的么?
假的! 隨著選擇世代的增加, 準(zhǔn)確性會(huì)下降, 因此需要不斷的更新測(cè)序群體. 需要不斷更新參考群, 可以將上代測(cè)序后有表型的個(gè)體加進(jìn)去.
2, 我需要測(cè)序多少個(gè)體, 才能夠達(dá)到評(píng)估準(zhǔn)確性顯著的提高?
在奶牛中, 每個(gè)公牛有很多后代, 每個(gè)組比較大, 測(cè)序個(gè)體大約是2000. 對(duì)于后代比較少, 遺傳力比較低的物種, 需要加大群體數(shù). 一般來(lái)說(shuō), 參考群個(gè)數(shù)至少要達(dá)到600, 才能達(dá)到準(zhǔn)確性顯著的提高.
3, rrBLUP 和GBLUP哪個(gè)好, 是使用兩步法(先估算SNP效應(yīng)值, 再計(jì)算育種值), 還是使用一步法(直接估計(jì)育種值)?
rrBLUP和GBLUP兩種方法是等價(jià)的, 使用rrBLUP估計(jì)方差組分比較容易, GBLUP計(jì)算比較容易. 當(dāng)權(quán)重(weights)是已知時(shí), 兩者是等價(jià)的.
4, SNP的權(quán)重重要么?
最初的研究表明, SNP的權(quán)重很重要, 但隨著SNP密度的增加, 將每個(gè)SNP的權(quán)重設(shè)置為一樣, 對(duì)于大部分性狀都是合適的.(即假定SNP都有相同的方差分布, 效應(yīng)值已知,都是微效多基因控制). 對(duì)于只有少數(shù)主效基因(QTL)控制的性狀, 效果可能不太好.
5, 可以使用一個(gè)群體作為參考群, 去預(yù)測(cè)另一個(gè)群體的GEBV么?
這需要看兩個(gè)群體的親緣關(guān)系. 如果一個(gè)群體中有很多都是另一個(gè)群體的親本或者祖先, 那么評(píng)估的準(zhǔn)確性就比較高, 如果親本或者祖先較少, 那么評(píng)估的準(zhǔn)確性就比較低. 極端情況下, 兩個(gè)群體沒(méi)有關(guān)系, 評(píng)估的準(zhǔn)確性甚至?xí)陀趥鹘y(tǒng)的EBV(pedigree-blup)
6, 一個(gè)群體的參考群, 得到的SNP效應(yīng)值, 可以用于其它群體的評(píng)估么?
不可以, SNP的效應(yīng)值只能在相似的群體中才能利用, 我們通過(guò)SNP得到的是精確度更好的加性方差組分. SNP的效應(yīng)值, 不能應(yīng)用于其它不相關(guān)的群體中.
7, 加性效應(yīng)中有多少可以用基因或連鎖的SNP解釋?
一般情況下, 多基因控制的性狀中, 一般是5%~20%, 不過(guò)最新的研究表明, 比例可以達(dá)到50%. 不過(guò), 這些研究可以在一些相關(guān)性比較少的個(gè)體中, 找到一些G關(guān)系矩陣.
8, 如果是候選群來(lái)源很多群體(家系)?
那這個(gè)候選群可以預(yù)測(cè)其它很多家系(因?yàn)楹蜻x群血緣比較復(fù)雜)以及他們之間簡(jiǎn)單的雜交. 但是G矩陣需要矯正和標(biāo)準(zhǔn)化, 以防止估計(jì)的偏差. 估算家系時(shí), 準(zhǔn)確性相對(duì)會(huì)降低.
9, 如果我們對(duì)多個(gè)世代都進(jìn)行測(cè)序, 對(duì)于準(zhǔn)確性的提高是否有幫助?
可能會(huì), 也可能不會(huì). 隨著選擇的進(jìn)行, G矩陣的準(zhǔn)確度會(huì)降低, 因?yàn)橹暗暮蜻x群由于選擇, 其背景發(fā)生了變化.
10, G矩陣和A矩陣有和區(qū)別?
如果系譜比較完整, 代數(shù)比較多, 結(jié)構(gòu)比較單一, 那么A矩陣和G矩陣基本一致, 差異的標(biāo)準(zhǔn)差可以小于0.04
11, 構(gòu)建G矩陣的方法有很多種, 他們之間的區(qū)別大么?
對(duì)于后代很多的物種(比如奶牛), 幾乎所有的G矩陣構(gòu)建結(jié)果得到的GEBV基本是一樣的. 當(dāng)群體較少, 或者系譜和基因組合并(一步法)時(shí), 如果兩者(A和G)沒(méi)有矯正和標(biāo)準(zhǔn)化, GEBV可能是有偏的, 準(zhǔn)確性也會(huì)降低.
12, 傳統(tǒng)的動(dòng)物模型, 有很多功能, 比如矯正, 母體效應(yīng), 群體分組(unknown parent groups), 雜交組等. 基因組選擇可以實(shí)現(xiàn)這些功能么?
這些都可以使用基因組選擇實(shí)現(xiàn), 試想一下, GBLUP相對(duì)于ABLUP, 只是將A矩陣代替為G矩陣. 可以進(jìn)行重復(fù)力分析, 母體效應(yīng)等傳統(tǒng)動(dòng)物模型可以做的功能. 群體分組這一塊, GBLUP研究的較少.
13, GBLUP估算的方差組分會(huì)比ABLUP估算的方差組分高么?
如果系譜是正確的話, 而G矩陣也進(jìn)行了矯正, 那么他們應(yīng)該是類似的. G矩陣估算的方差組分的誤差可能會(huì)更小, 如果擁有了基因組信息, 可以不用使用系譜, 直接使用基因組信息進(jìn)行方差組分的估算.
14, 如果使用高密度的SNP芯片, 會(huì)提高估算的準(zhǔn)確性么?
目前還不清楚, 使用50K的芯片估算的準(zhǔn)確性相當(dāng)好了, 所以繼續(xù)提高SNP密度效果不限. 如果群體比較小, 而芯片密度比較高, 會(huì)造成虛假的提高.
15, 腦洞大一點(diǎn), 如果有了完整的基因組數(shù)據(jù), 鑒別出了所有的易感SNP位點(diǎn)(關(guān)聯(lián)的SNP), 在一個(gè)群體中或者混合群體中估算了這些SNP的效應(yīng)值, 那么我們是不是可以準(zhǔn)確預(yù)測(cè)任何個(gè)體的育種值?
這個(gè)問(wèn)題好, 基因之間有復(fù)雜的網(wǎng)絡(luò)關(guān)系, 而且易感基因和性狀之間的關(guān)系通常也是非線性的, 換句話說(shuō), 你有一些易感的SNP, 想要得到表型值, 還要考慮環(huán)境, 互作等. 當(dāng)然, 對(duì)于遺傳力高的或者主效基因(QTL)控制的性狀, 也是有一定參考意義的.
16, 如果上一個(gè)問(wèn)題的結(jié)果是這樣, 那么為什么動(dòng)物模型可以工作的很好?
在短期的評(píng)估, 效果比較好, 而且動(dòng)物模型評(píng)估時(shí)往往是針對(duì)下一個(gè)世代, 環(huán)境變化表較小.
17, 基因組的信息很多, 如果我們?nèi)〉昧俗銐虻臄?shù)據(jù), 是不是可以取得突破性進(jìn)展?
考慮到所有的胎次, 一對(duì)父母的后代數(shù)一般不超過(guò)100, 這些后代還會(huì)有突變.
18, 動(dòng)物育種, 基因組選擇的下一個(gè)技術(shù)會(huì)是什么?
沒(méi)人知道, 目前, 基因組選擇大大提高了準(zhǔn)確性, 但還有進(jìn)一步的利用空間, 比如雜交或者基因與環(huán)境互作等.
19, 基因組選擇中, 什么是最重要的?
注意表型和基因型數(shù)據(jù)的準(zhǔn)確性, 研究表明, 如果基因型數(shù)據(jù)質(zhì)量較差, 會(huì)大大影響分析結(jié)果.
Comments by or discussions with Ignacio Aguilar,Luc Janns, Andres Legarra, Tony Reverter and Zulma Vitezica are gratefully acknowledged.