Yu JM, Pressoir G, Briggs WH, et al (2006) A unified mixed-model method for association mapping that accounts for multiple levels of relatedness. Nat Genet 38:203–208.
由于種群結(jié)構(gòu)可能導(dǎo)致虛假關(guān)聯(lián)隐解,因此限制了人類和植物遺傳學(xué)中關(guān)聯(lián)研究的使用。然而惧眠,如果功能關(guān)聯(lián)的真實(shí)信號(hào)可以與群體結(jié)構(gòu)1,2產(chǎn)生的大量錯(cuò)誤信號(hào)分離,則關(guān)聯(lián)映射具有很大的希望虐秋。我們已經(jīng)開發(fā)出一種統(tǒng)一的混合模型方法摊唇,可以通過隨機(jī)遺傳標(biāo)記檢測(cè)到同時(shí)考慮多個(gè)相關(guān)性水平。我們將這種新方法應(yīng)用于兩個(gè)樣本:一個(gè)基于家庭的14個(gè)人類家庭樣本授帕,用于定量基因表達(dá)解剖,以及277個(gè)具有復(fù)雜家族關(guān)系和種群結(jié)構(gòu)的不同玉米自交系樣本浮梢,用于數(shù)量性狀解剖跛十。我們的方法比其他方法更好地控制了I型和II型錯(cuò)誤率。由于這種新方法跨越了基于家系的關(guān)聯(lián)樣本和結(jié)構(gòu)化關(guān)聯(lián)樣本之間的邊界秕硝,因此它為當(dāng)前可用的關(guān)聯(lián)映射方法提供了強(qiáng)大的補(bǔ)充芥映。
群體結(jié)構(gòu)在生物體中是普遍的3,4。由于地理远豺,自然選擇或人工選擇奈偏,它可以以畜群,殖民地躯护,種族或其他類型的聚集形式自然產(chǎn)生霎苗。對(duì)于關(guān)聯(lián)作圖,給定樣本可以屬于由與當(dāng)?shù)剡m應(yīng)相關(guān)的種群結(jié)構(gòu)定義的五個(gè)類別之一或者來自最近的共同性的多樣化選擇和家族相關(guān)性(圖1)榛做。理想情況下唁盏,只要感興趣的性狀分布均勻(圖1),具有最小種群結(jié)構(gòu)或家族相關(guān)性(區(qū)域I)的樣本就會(huì)產(chǎn)生最大的統(tǒng)計(jì)效力检眯。然而厘擂,這些樣品通常證明非常難以收集,尺寸小和/或具有窄的遺傳基礎(chǔ)锰瘸。已經(jīng)開發(fā)了基于家庭的樣本(區(qū)域II)以避免種群結(jié)構(gòu)的影響刽严,但這些樣本也受到樣本大小和等位基因多樣性的限制,并且難以收集避凝,特別是對(duì)于晚發(fā)性人類疾参杼选(圖1) )。對(duì)于數(shù)量性狀管削,定量傳遞不平衡檢驗(yàn)(QTDT)是一種廣泛用于與這些基于家族的樣本的關(guān)聯(lián)作圖的方法7倒脓。物種增加的樣本以及物種中更廣泛的等位基因多樣性通常包含種群結(jié)構(gòu)(區(qū)域IV)或包括結(jié)構(gòu)化種群內(nèi)的家族關(guān)系(區(qū)域III;圖1)。對(duì)于這些樣品含思,結(jié)構(gòu)化關(guān)聯(lián)(SA)和基因組控制(GC)是人類和植物研究中常用的方法崎弃,用于控制由該種群結(jié)構(gòu)引起的假陽性(I型錯(cuò)誤)9?3含潘。使用GC饲做,隨機(jī)標(biāo)記用于估計(jì)和調(diào)整由種群結(jié)構(gòu)產(chǎn)生的測(cè)試統(tǒng)計(jì)數(shù)據(jù)的膨脹,假設(shè)這種結(jié)構(gòu)對(duì)所有基因座具有類似的影響遏弱。 SA分析使用隨機(jī)標(biāo)記來估計(jì)種群結(jié)構(gòu)盆均,然后將其納入進(jìn)一步的統(tǒng)計(jì)分析。然而漱逸,對(duì)于區(qū)域III中的樣本泪姨,僅考慮種群結(jié)構(gòu)可能導(dǎo)致對(duì)假陽性的控制不足或由于家族相關(guān)性導(dǎo)致的功率損失(圖1)居砖。在評(píng)估具有非常高水平的種群結(jié)構(gòu)以及不同水平的家族相關(guān)性的樣本時(shí),哪些方法將被證明是最有用的還有待觀察(區(qū)域V;圖1)驴娃。
在本文中奏候,我們提出了一種新的關(guān)聯(lián)映射方法,適用于II區(qū)和III區(qū)的樣本(圖1)唇敞。對(duì)于基于家庭的樣本蔗草,我們將我們的方法應(yīng)用于來自14個(gè)中心d'Polyude du Polymorphisme Humain(CEPH)猶他州家系的永生化B細(xì)胞中基因表達(dá)水平的微陣列數(shù)據(jù)。在該研究中疆柔,六種基因表達(dá)表型被認(rèn)為是繪制表達(dá)數(shù)量性狀基因座(eQTL)的表型性狀咒精。對(duì)于含有復(fù)雜家族關(guān)系和種群結(jié)構(gòu)的樣本,我們檢測(cè)了277種不同玉米自交系的三種數(shù)量性狀旷档,代表了世界公共育種計(jì)劃中存在的多樣性15模叙。由于玉米是一種高度近交的物種,我們樣本中主要亞群的種群分化(Fst)范圍從0.047(SSR)到0.073(SNP)鞋屈,類似于最近的人類研究11(中國日本和Fst的Fst范咨?0.013?大陸之間的比例為0.145)厂庇。當(dāng)我們包括一個(gè)次要的瓶頸亞組時(shí)渠啊,總體Fst上升到0.106(SSR)和0.118(SNP)。
我們的關(guān)聯(lián)作圖方法整合了基因組工具权旷,以發(fā)現(xiàn)種群結(jié)構(gòu)和家族關(guān)系替蛉,這種傳統(tǒng)的混合模型框架長期以來被動(dòng)物遺傳學(xué)家使用16?8拄氯。將混合模型方法應(yīng)用于一些馴養(yǎng)動(dòng)物物種之外的一個(gè)明顯障礙是譜系記錄通常是未知的或不準(zhǔn)確的躲查∫氚兀基因組工具現(xiàn)在允許我們檢測(cè)樣本中的種群結(jié)構(gòu)(Q)和相對(duì)親緣關(guān)系(K)艇纺∏猓基于標(biāo)記的相對(duì)親緣關(guān)系估計(jì)證明對(duì)不同人群的定量遺傳研究有用19,20。該K估計(jì)通過調(diào)整兩個(gè)個(gè)體之間的狀態(tài)的同一性概率來通過下降來近似同一性侣签,其中隨機(jī)個(gè)體之間的狀態(tài)具有平均身份概率影所。對(duì)于CEPH樣本猴娩,我們用K矩陣替換傳統(tǒng)混合模型中基于譜系的共同矩陣(G)卷中,以定義個(gè)體間遺傳協(xié)方差的程度议忽。沒有檢測(cè)到種群結(jié)構(gòu),并且Q不包括在混合模型分析中侦镇。對(duì)于玉米樣本,我們將Q和K都放入混合模型中以考慮多個(gè)相關(guān)性水平闹炉。