Tanaka2017 GS的貝葉斯優(yōu)化

Tanaka, R., and Iwata, H. 2017. Bayesian optimization for genomic selection: a method for discovering the best genotype among a large number of candidates. Theor. Appl. Genet. (123456789): 1–13. Springer Berlin Heidelberg. doi:10.1007/s00122-017-2988-z.

摘要

提出了一種基于優(yōu)化算法的新的預(yù)育策略泼差,并通過模擬進行了評估。這種策略可以找到更好的基因型與較少的表型分型努力。摘要:基因組預(yù)測是一種很有前途的方法效五,用于在基因庫中保存的大量種質(zhì)資源中搜索優(yōu)良的基因型亡蓉。當(dāng)一些種質(zhì)進行表型和基因分型時续挟,可以建立預(yù)測模型叹阔,并且可以從其標記基因型預(yù)測剩余種質(zhì)的基因型值截酷。在這項研究中蔓同,我們著重于基因組預(yù)測在預(yù)培育中的應(yīng)用饶辙,并提出了一種新的策略,可以降低發(fā)現(xiàn)更好種質(zhì)所需的表型分型的成本斑粱。將基因組預(yù)測優(yōu)越基因型作為優(yōu)化問題弃揽,引入貝葉斯優(yōu)化方法進行求解。貝葉斯優(yōu)化,根據(jù)預(yù)期的改善(EI)作為選擇標準矿微,抽樣未觀察到的投入痕慢,似乎是有利于prebreeding。 EI取決于基因型值的預(yù)測分布冷冗,而通常的選擇僅取決于點估計守屉。我們模擬了候選基因型中最佳基因型的搜索,并且顯示基于EI的策略比通常的和隨機選擇策略需要更少的基因型來鑒定最佳基因型蒿辙。因此拇泛,貝葉斯優(yōu)化對于將基因組預(yù)測應(yīng)用于預(yù)培育可能是有用的,并且會減少大量候選人中找到最佳加入所需的表型加入的數(shù)量思灌。


介紹

為了在2050年之前為90多億人口提供糧食俺叭,我們需要通過新的育種技術(shù)和利用種質(zhì)資源中的遺傳多樣性來加速作物遺傳改良(Tester和Langridge,2010)泰偿。由于精英繁殖種群和商業(yè)栽培種在其長期的馴化和選擇歷史中失去了遺傳多樣性熄守,所以野生,外來或本地種質(zhì)的豐富變異的進化對于促進植物育種是至關(guān)重要的(Tanksley and McCouch 1997; Jordan et al耗跛。 McCouch等裕照,2013)。為了收集调塌,保存晋南,保存和分發(fā)代表作物品種遺傳多樣性的種子(如Sachs,2009)羔砾,已做出了大量的國內(nèi)和國際努力负间。
鑒定特定育種目標的最佳種質(zhì)是耗費時間和勞力的,因為它要求在植物基因庫中保存大量種質(zhì)的表型姜凄。為了便于篩選政溃,已經(jīng)在各種作物物種中開發(fā)了核心種質(zhì)(少量代表性種質(zhì)的部分集合; Brown 1989)。然而态秧,核心收集戰(zhàn)略可能會限制核心收集品之外的加入者的使用董虱。例如,核心集合中可能缺少有價值的稀有等位基因申鱼。已經(jīng)提出了替代的策略空扎,例如種質(zhì)策略的重點鑒定(例如,Khazaei等润讥,2013)转锈,但缺點是圖依賴于與目標性狀有關(guān)的農(nóng)業(yè)生態(tài)信息,并且不能使用遺傳信息楚殿。
基因組選擇(GS; Meuwissen et al.2001)依靠基因組預(yù)測來發(fā)現(xiàn)種質(zhì)資源中的優(yōu)質(zhì)種質(zhì)撮慨。與表型分型相比竿痰,標記基因分型即使在標記數(shù)量較多的情況下也能實現(xiàn)高通量且更具成本效益∑瞿纾可以基于訓(xùn)練數(shù)據(jù)(表型和全基因組標記數(shù)據(jù)對)建立基因組預(yù)測模型影涉,并基于其全基因組標記基因型預(yù)測沒有表型數(shù)據(jù)的基因型的基因型值。基因組預(yù)測可用于鑒定種質(zhì)資源中的優(yōu)質(zhì)材料规伐,并將其應(yīng)用于預(yù)育蟹倾,目的是鑒定大量材料中的高潛力基因型(Pace等,2015; Chang等猖闪,2016; Gorjanc等鲜棠,2016 ; Yu等,2016)培慌。
全局優(yōu)化是一個數(shù)學(xué)問題豁陆,用于在輸入空間中查找使函數(shù)最大化的輸入值,而預(yù)先培育的目的是在候選基因型中找到最好(或更好)的基因型吵护。為了有效實現(xiàn)全球最優(yōu)化盒音,我們需要平衡兩個相互沖突的目標:探索和利用。通常馅而,我們只是利用我們的預(yù)測模型來找到最好的基因型;選擇具有較高預(yù)測基因型值的基因型祥诽。由于我們的預(yù)測模型并不總是正確的,所以這種純粹的利用策略可能會發(fā)現(xiàn)與訓(xùn)練數(shù)據(jù)集密切相關(guān)的更好的基因型(局部最優(yōu))瓮恭,而不是所有候選基因型(全局最優(yōu))中的最佳基因型雄坪。為避免陷入局部最優(yōu),需要對輸入空間進行廣泛的探索偎血,以確保選定的基因型和訓(xùn)練數(shù)據(jù)集的遺傳多樣性。探索-利用折衷是全球優(yōu)化中的一個眾所周知的問題盯漂,并且已經(jīng)開發(fā)了幾種算法來解決這個問題颇玷,包括貝葉斯優(yōu)化(Mockus 1994; Jones等人1998; Shahriari等人2016),但是它從未適用于前期育種的情況就缆。
在這項研究中帖渠,我們介紹貝葉斯優(yōu)化在與基因組預(yù)測育種的背景下,并提出了一種新的有效的策略竭宰,以發(fā)現(xiàn)集合中最好的基因型空郊,同時盡量減少表型篩選步驟的數(shù)量。我們的新策略使用一個新的標準選擇未經(jīng)測試的基因型切揭。我們的策略和通常的GS之間的差異在于選擇取決于預(yù)測的分布或預(yù)測的基因型值的點估計狞甚。我們的策略建議選擇不僅具有高預(yù)測值而且具有高后驗方差(換言之,預(yù)測的“不確定性”)的基因型廓旬,而通常的GS選擇僅具有高預(yù)測值的基因型哼审。通過考慮預(yù)測的不確定性,勘探開發(fā)權(quán)衡將是平衡的。在GS中涩盾,與訓(xùn)練群體相關(guān)的基因型在預(yù)測中往往具有很大的不確定性十气。因此,不確定基因型的選擇導(dǎo)致對遺傳空間的廣泛搜索春霍。因此砸西,我們的策略平衡了探索(通過基于“不確定性”搜索基因型進行的基因空間的廣泛搜索)和開發(fā)(根據(jù)預(yù)測選擇更好的基因型),而通常的GS是純粹的開發(fā)址儒。我們通過模擬來評估我們的策略的潛力芹枷,假設(shè)最好的基因型在基因型中具有最高的基因型值。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末离福,一起剝皮案震驚了整個濱河市杖狼,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌妖爷,老刑警劉巖蝶涩,帶你破解...
    沈念sama閱讀 217,084評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異絮识,居然都是意外死亡绿聘,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,623評論 3 392
  • 文/潘曉璐 我一進店門次舌,熙熙樓的掌柜王于貴愁眉苦臉地迎上來熄攘,“玉大人,你說我怎么就攤上這事彼念∨不” “怎么了?”我有些...
    開封第一講書人閱讀 163,450評論 0 353
  • 文/不壞的土叔 我叫張陵逐沙,是天一觀的道長哲思。 經(jīng)常有香客問我,道長吩案,這世上最難降的妖魔是什么棚赔? 我笑而不...
    開封第一講書人閱讀 58,322評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮徘郭,結(jié)果婚禮上靠益,老公的妹妹穿的比我還像新娘。我一直安慰自己残揉,他們只是感情好胧后,可當(dāng)我...
    茶點故事閱讀 67,370評論 6 390
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著抱环,像睡著了一般绩卤。 火紅的嫁衣襯著肌膚如雪途样。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,274評論 1 300
  • 那天濒憋,我揣著相機與錄音何暇,去河邊找鬼。 笑死凛驮,一個胖子當(dāng)著我的面吹牛裆站,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播黔夭,決...
    沈念sama閱讀 40,126評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼宏胯,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了本姥?” 一聲冷哼從身側(cè)響起肩袍,我...
    開封第一講書人閱讀 38,980評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎婚惫,沒想到半個月后氛赐,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,414評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡先舷,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,599評論 3 334
  • 正文 我和宋清朗相戀三年艰管,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蒋川。...
    茶點故事閱讀 39,773評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡牲芋,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出捺球,到底是詐尸還是另有隱情缸浦,我是刑警寧澤,帶...
    沈念sama閱讀 35,470評論 5 344
  • 正文 年R本政府宣布氮兵,位于F島的核電站裂逐,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏胆剧。R本人自食惡果不足惜絮姆,卻給世界環(huán)境...
    茶點故事閱讀 41,080評論 3 327
  • 文/蒙蒙 一醉冤、第九天 我趴在偏房一處隱蔽的房頂上張望秩霍。 院中可真熱鬧,春花似錦蚁阳、人聲如沸铃绒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,713評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽颠悬。三九已至矮燎,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間赔癌,已是汗流浹背诞外。 一陣腳步聲響...
    開封第一講書人閱讀 32,852評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留灾票,地道東北人峡谊。 一個月前我還...
    沈念sama閱讀 47,865評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像刊苍,于是被迫代替她去往敵國和親既们。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,689評論 2 354

推薦閱讀更多精彩內(nèi)容