RomeroNavarro2017 GWAS 玉米開花

Romero Navarro JA, Willcox M, Burgue?o J, et al. A study of allelic diversity underlying flowering-time adaptation in maize landraces. Nature Genetics, 2017, 49(3): 476–480. DOI: 10.1038/ng.3784.

摘要

馴化物種的地方品種(傳統(tǒng)品種)保留了有用的遺傳變異,但由于少數(shù)有用的等位基因與數(shù)百種不良等位基因之間存在遺傳聯(lián)系,它們尚未開發(fā)。我們整合了兩種方法來描述4,471個玉米地方品種的多樣性。

  • 首先殿遂,我們繪制了控制緯度和海拔適應的基因組區(qū)域,并確定了1,498個基因。
  • 其次,我們使用F-one關(guān)聯(lián)作圖(FOAM)來繪制控制開花時間的基因,跨越22個環(huán)境匾荆,并鑒定了1,005個基因拌蜘。
    總的來說杆烁,我們發(fā)現(xiàn)61.4%的與高海拔相關(guān)的單核苷酸多態(tài)性(SNPs)也與開花時間有關(guān)。超過一半與高度相關(guān)的SNP在大的結(jié)構(gòu)變異(倒位简卧,著絲粒和pericentromeric區(qū)域)內(nèi)兔魂。組合的mapping結(jié)果表明,雖然花卉調(diào)節(jié)網(wǎng)絡基因?qū)μ镩g變異有很大貢獻举娩,但超過90%的貢獻基因可能具有間接影響析校。我們的雙重策略可用于利用植物和動物的種植多樣性。

在線方法

表型數(shù)據(jù)分析铜涉。

為了估計地方品種親本的育種值智玻,對于每個試驗,在ASREML(v.3.0)中使用限制性最大似然法擬合混合線性模型芙代,使用后代的日歷天來雄性或雌性開花作為響應變量吊奢。模型包括檢查,測試器和混合的固定效果以及完整嵌套模型中的隨機加入效果纹烹。 此外页滚,該模型包括行和列的隨機效應,使用行和列中數(shù)量級為1的自回歸模型來控制實驗噪聲作為場變化的乘積铺呵。 所有隨機效應都被認為是彼此獨立的裹驰。 使用的模型可表示如下:
y_{ijkml} = \mu + \gamma_{i} + \lambda_{j} + \alpha_{k} + \beta_{l(k)} + \delta_{m(kl)} + \varepsilon_{ij}

響應變量=均值+行+列+組+tester+種質(zhì)+殘差

基因分型。

使用ApeKI作為限制酶片挂,使用每個測序板~96個個體的復制水平幻林,使用基因分型 - 測序(GBS)21對用作男性親本的種質(zhì)進行基因分型。使用Illumina HiSeq產(chǎn)生大約8-109個測序讀數(shù)用于地方品種宴卖,并且使用TASSEL46將序列讀數(shù)與另外40,000個玉米品系一起作為GBS構(gòu)建2.7的一部分進行分析滋将。平均而言,每個人和每個站點的缺失數(shù)據(jù)為0.5(補充圖10)症昏。通過比較被叫位點的深度分布随闽,每個位點的中值讀數(shù)為2(補充圖11)。對于關(guān)聯(lián)分析肝谭,使用BEAGLE4(參考文獻22)估算缺失數(shù)據(jù)掘宪,已顯示其在玉米雜合材料中產(chǎn)生最佳的當前準確度47。我們觀察到插補精度攘烛,R2 = 0.68魏滚,插補后沒有丟失數(shù)據(jù)。在插補后坟漱,過濾SNP的次要等位基因頻率> 1%鼠次,在基因組中產(chǎn)生大約500,000個雙等位基因標記。

多樣性評估。

對于Mantel檢驗23腥寇,我們根據(jù)來自種質(zhì)(緯度成翩,經(jīng)度和海拔)的地理數(shù)據(jù)計算了成對歐幾里德距離矩陣。我們估計并測試了高度赦役,緯度和經(jīng)度的單獨歐幾里德矩陣以及一個聯(lián)合矩陣麻敌。使用TASSEL從30,000個非插入標記的全基因組隨機樣本估計遺傳距離矩陣。遺傳矩陣與關(guān)節(jié)或高度歐氏距離矩陣之間的相關(guān)性為0.46掂摔,P值估計基于1,000個排列术羔。緯度和海拔高度分別與遺傳距離有0.04和0.07的相關(guān)性。使用R庫“ade4”(參考文獻48)進行Mantel測試乙漓。使用R中的“cmds”函數(shù)對遺傳距離矩陣進行MDS(多維縮放)级历。

重組

為了估計LD,需要具有精確雜合子調(diào)用的定相標記簇秒。覆蓋深度的分布(補充圖11)顯示我們組中的大多數(shù)GBS標記具有恰好1的深度鱼喉,其中一半標記具有等于或大于2的深度。在沒有相位或足夠深度的情況下對于所有站點趋观,我們使用非推算的SNP標記估計了類似LD的統(tǒng)計量扛禽。為了解釋缺乏相位信息和雜合子調(diào)用不足,我們的類似LD的統(tǒng)計量估計了100個位置非重疊窗口的純合標記與軟件TASSEL上的LD功能之間的相關(guān)性皱坛。對于GBS標記编曼,我們發(fā)現(xiàn)這是具有信息相關(guān)性的最小窗口大小。我們對LD的顯著增加感興趣剩辟,這些增加影響了人群中多個人的大區(qū)域掐场。因此,我們通過取中值將相關(guān)性匯總到1-Mb區(qū)域贩猎。為了比較LD和重組值熊户,我們估計了1-Mb滑動窗口之間的相關(guān)性(i)log10(中值LD估計值),(ii)使用美國和中國NAM估算的中值交叉概率的對數(shù)值種群24吭服,和(iii)中值種群重組率(rho)的對數(shù)估計改良品系和地方品種Hapmap2項目24嚷堡。我們的LD估計值顯示與基因密度(r = -0.57)和NAM交叉概率8(r = -0.45)呈負相關(guān)。我們觀察到我們的LD樣統(tǒng)計量和歷史重組的群體遺傳估計值(rho)之間存在適度的負相關(guān)(r = -0.33)24,25艇棕◎蚪洌基于全局中值LD的斜率變化來定義高LD區(qū)域(補充圖12)。因此沼琉,高LD區(qū)域是具有中值LD> 0.01的那些區(qū)段北苟。總共有256個高LD區(qū)域打瘪,占基因組的7.8%友鼻。在候選基因中傻昙,只有PhyB1(植物色素B1),Gl15(Glossy15)和ZCN13屬于高LD組彩扔,因此被排除在進一步的基因水平分析之外屋匕。

開花時間全基因組關(guān)聯(lián)和基因組預測。

使用線性混合模型49,50對所有試驗分兩步進行關(guān)聯(lián)分析借杰。對于每個性狀(雄性和雌性開花的天數(shù)),擬合兩個模型进泼,一個具有特征“最佳線性無偏預測”(BLUP)作為響應變量蔗衡,另一個具有相同BLUP的標準化值。雖然可以使用以生長度天數(shù)形式的累積熱單位來標準化不同地點的作物物候數(shù)據(jù)集乳绕,但所使用的標準化包括減去試驗的平均值并除以相應的s.d.這樣做是為了評估結(jié)果的一致性绞惦,因為各種試驗中的性狀差異不均勻。兩個GWAS模型的P值之間的相關(guān)性為0.84洋措。
第一步模型包括試驗的固定效應(分類)济蝉,10個MDS權(quán)重(數(shù)值)形式的種群結(jié)構(gòu),共同解釋了大約13%的遺傳方差和10.6%的表型變異菠发,以及雜交的影響用作每個種質(zhì)雜交的父母王滤。相關(guān)性的隨機效應以親屬矩陣的形式被添加到兩個模型中。使用與MDS權(quán)重相同的SNP子集估計親屬矩陣滓鸠。使用R軟件包EMMREML擬合混合模型雁乡。在擬合第一模型后含有殘差的向量在第二步模型中擬合作為單標記分析的響應變量。使用R擬合模型糜俗,標記嵌套在試驗水平內(nèi)踱稍。
使用的模型方程是
Y_{ijk} = \mu + T_{i} + H_{ij} + Q_{ijk} + Z_{u} + \varepsilon_{ijk}

其中Y_{ijk}是響應變量,\mu是總體平均值悠抹,Ti是第i次試驗的效果珠月,Hij是第i次試驗中第j個測試者的效果,Qijk是包含10次的人口結(jié)構(gòu)效應來自MDS楔敌,Zu的權(quán)重啤挎,其中u是未知隨機多基因效應的大小為n(個體數(shù))的向量,其具有均值為零的分布和G = 2K\sigma_a^2的協(xié)方差矩陣梁丘,其中K是具有元素的共同祖先矩陣從30,000個隨機SNP計算kij(i侵浸,j = 1,2,... n)氛谜,并且eijk是包含殘差的矢量掏觉。
在關(guān)聯(lián)模型的第二步中,來自第一模型的殘差被擬合為以下模型中的響應變量

Y_{i} = S [t] + \varepsilon_{i}

其中Yi是來自先前模型的殘差值漫,S是嵌套在試驗t中的SNP效應澳腹。該模型對零假設使用F檢驗,表明在所有試驗中每個SNP的效果為0。另一種假設是SNP對任何試驗都有影響酱塔。測試這一假設的原因是每個SNP的影響可以并且經(jīng)常會改變價值和方向沥邻。這是所有試驗中不同頻率的等位基因分離的結(jié)果哀军,以及測試的SNP與因果多態(tài)性之間的相位變化译柏。我們觀察到與P值的預期分布的顯著偏差(補充圖13);因此,考慮到錯誤的發(fā)現(xiàn)率接癌,我們只考慮基于P值的SNP的前1%顯著蕊玷,其中-log10(P值)均為> 18邮利。我們推斷候選基因的顯著性將取決于當?shù)豅D和基因型覆蓋率;因此,圍繞候選基因的較高比例的顯著SNP將指示基因本身的關(guān)聯(lián)而不是整個LD區(qū)域或由于更高的基因型覆蓋垃帅。因此延届,我們研究了候選基因上游和下游50-kb區(qū)域內(nèi)的SNP顯著關(guān)聯(lián),并使用R包GenomicRanges將SNP分配到最近的基因贸诚。
使用軟件GAPIT進行全基因組預測方庭。每個試驗運行模型,并通過在每個試驗的10個重復中進行五重交叉驗證來測量準確度酱固。每個特征和試驗運行兩個模型械念。【使用不同分不的SNP獲取G矩陣】一個模型使用親屬矩陣运悲,其針對888個相關(guān)基因組區(qū)域中的每一個估計具有一個SNP订讼,另一個模型使用714個均勻分布的隨機SNP,并且第三個模型使用30,000個隨機SNP來估計親屬矩陣扇苞。所有模型都包括十個MDS權(quán)重以考慮人口結(jié)構(gòu)欺殿。

全球范圍內(nèi)與海拔和緯度的關(guān)聯(lián)。

我們有興趣了解對開花時間變化以及高度和緯度適應性做出貢獻的基因組區(qū)域鳖敷。我們使用廣義線性模型進行全基因組關(guān)聯(lián)脖苏,其中高度和緯度作為響應變量和標記,以1%的頻率過濾定踱,作為解釋變量棍潘。與使用地理學作為關(guān)聯(lián)研究中的響應變量的其他繪圖研究一致,具有主成分權(quán)重形式的種群結(jié)構(gòu)的協(xié)變量的模型崖媚,以及包括親屬矩陣或親屬和主成分權(quán)重兩者的混合線性模型亦歉,顯示非常有限的關(guān)聯(lián)(補充圖14)。這主要是由于當?shù)剡m應與人口結(jié)構(gòu)之間的高度協(xié)方差畅哑,因為當?shù)剡m應的選擇導致了人口結(jié)構(gòu)肴楷。這意味著考慮局部適應的模型降低了假陽性率,但也顯著增加了假陰性率荠呐。為了從廣義線性模型的結(jié)果降低假陽性率并使用額外的獨立信息建立生物學意義的顯著性閾值赛蔫,我們使用最顯著的開花時間GWAS SNP估計重疊率砂客。重疊率被定義為共享的雄性和雌性頂部開花時間SNP與高度或緯度之間的重疊SNP的集合除以跨越顯著性閾值的集合的并集。換句話說呵恢,假設開花時間相關(guān)的SNP代表我們當前最佳的真陽性候選者鞠值,重疊率用于最大化P值閾值的真陽性,使假陰性最小化渗钉。因此彤恶,估計百分位數(shù)的總體比率在0.001和0.010之間。例如鳄橘,對于第一個分位數(shù)閾值(0.001)粤剧,海拔高度的重疊率對應于與前5,000個開花時間SNP重疊的前0.001個分位數(shù)(大約500)的SNP數(shù)除以開花的總和。 - 時間SNP和該分位數(shù)處的高度SNP挥唠。從重疊率結(jié)果中選擇的顯著性閾值(補充圖5)是高度的0.005百分位數(shù)(關(guān)聯(lián)SNP的前0.5%,-log10(P值)> 208.2;補充表6)和緯度的0.01百分位數(shù)(關(guān)聯(lián)SNPs的前1%-log10(P值)> 61.63;補充表7)焕议。在補充圖5中可以觀察到宝磨,在相同的分位數(shù)值上,與具有緯度的SNP相比盅安,海拔與開花時間相關(guān)的SNP具有顯著更高的重疊唤锉,可能是由于地方品種主要來自非光周期誘導位置。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末别瞭,一起剝皮案震驚了整個濱河市窿祥,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌蝙寨,老刑警劉巖晒衩,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異墙歪,居然都是意外死亡听系,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進店門虹菲,熙熙樓的掌柜王于貴愁眉苦臉地迎上來靠胜,“玉大人,你說我怎么就攤上這事毕源±四” “怎么了?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵霎褐,是天一觀的道長址愿。 經(jīng)常有香客問我,道長冻璃,這世上最難降的妖魔是什么必盖? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任拌牲,我火速辦了婚禮,結(jié)果婚禮上歌粥,老公的妹妹穿的比我還像新娘塌忽。我一直安慰自己,他們只是感情好失驶,可當我...
    茶點故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布土居。 她就那樣靜靜地躺著,像睡著了一般嬉探。 火紅的嫁衣襯著肌膚如雪擦耀。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天涩堤,我揣著相機與錄音眷蜓,去河邊找鬼。 笑死胎围,一個胖子當著我的面吹牛吁系,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播白魂,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼汽纤,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了福荸?” 一聲冷哼從身側(cè)響起蕴坪,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎敬锐,沒想到半個月后背传,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡台夺,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年续室,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片谒养。...
    茶點故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡挺狰,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出买窟,到底是詐尸還是另有隱情丰泊,我是刑警寧澤,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布始绍,位于F島的核電站瞳购,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏亏推。R本人自食惡果不足惜学赛,卻給世界環(huán)境...
    茶點故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一年堆、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧盏浇,春花似錦变丧、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至滴劲,卻和暖如春攻晒,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背班挖。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工鲁捏, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人萧芙。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓给梅,卻偏偏與公主長得像,于是被迫代替她去往敵國和親末购。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內(nèi)容