Famliy-based關(guān)聯(lián)分析

為什么要做基于家系的關(guān)聯(lián)分析奇钞?

關(guān)聯(lián)分析是挖掘復(fù)雜疾病致病位點(diǎn)的一個(gè)有效方法澡为。在人類(lèi)的疾病基因研究中,一般有兩種方法:一是條件-對(duì)照法(case-control景埃, CC)媒至;二是傳遞連鎖不平衡法(transmission disequilibrium test, TDT) (Spielman et al.谷徙,1993)拒啰。條件對(duì)照法要考慮到如何使患者組與正常對(duì)照組相匹配,以及人群完慧、地理和社會(huì)背景等谋旦。而在這些不同條件下,等位片段的頻率往往有很大的差異,這一現(xiàn)象被稱(chēng)為群體分層(populationstratification)册着。在條件-對(duì)照研究中出現(xiàn)陽(yáng)性結(jié)果時(shí)拴孤,產(chǎn)生關(guān)聯(lián)可以有3種原因:一是這個(gè)位點(diǎn)就是致病位點(diǎn);二是這個(gè)位點(diǎn)與疾病位點(diǎn)存在連鎖不平衡(LD)指蚜;三是這種關(guān)聯(lián)性是由于混雜因素(Confounder)造成的虛假聯(lián)系乞巧。在條件一對(duì)照研究中出現(xiàn)陽(yáng)性結(jié)果時(shí),產(chǎn)生關(guān)聯(lián)可以有3種原因:一是這個(gè)位點(diǎn)就是致病位點(diǎn)摊鸡;二是這個(gè)位點(diǎn)與疾病位點(diǎn)存在連鎖不平衡(LD)绽媒;三是這種關(guān)聯(lián)性是由于混雜因素(Confounder)造成的虛假聯(lián)系。這種混雜很大程度上是群體分層(患病組與對(duì)照組在種族免猾、人類(lèi)學(xué)起源是辕、臨床情況甚至年齡或社會(huì)階層等方面若不匹配,尤其是群體的遺傳背景差異造成的兩組間遺傳標(biāo)記等位基因頻率的差異猎提,則可導(dǎo)致假陽(yáng)性結(jié)果获三,即群體分層[Population stratiifcation]問(wèn)題[AltshulerDetal,2000]引起的锨苏,為克服這一問(wèn)題疙教,在研究方案的設(shè)計(jì)上必須注重病例組與對(duì)照組相匹配,對(duì)家系樣本需增加患者父母未傳遞的等位片段作匹配比較伞租。當(dāng)某一特定等位片段在傳遞時(shí)出現(xiàn)的概率比隨機(jī)的概率顯著增多時(shí)贞谓,則認(rèn)為存在連鎖不平衡】基于此原理的遺傳統(tǒng)計(jì)方法有對(duì)隱性遺傳模式非常有效的傳遞不平衡(transmission disequilibrium test裸弦,TDT),以及患者家系對(duì)照者分析(affected family—based controls作喘,AFBAC)理疙、單倍型相對(duì)風(fēng)險(xiǎn)率分析(haplotyperelativerisk,HRR)等方法泞坦。TDT是在家系內(nèi)進(jìn)行關(guān)聯(lián)分析(即famliy-based關(guān)聯(lián)分析)窖贤,觀察雙親(至少一個(gè)是雜合子)將標(biāo)記位點(diǎn)等位基因傳遞給患者的頻率。

famliy-based關(guān)聯(lián)分析原理

傳遞不平衡檢驗(yàn)(TDT)是Spielman 在 1993 年發(fā)明的贰锁,它結(jié)合了連鎖分析(觀察家系內(nèi)部的傳遞關(guān)系)和關(guān)聯(lián)分析(基于普通人群主之,不需更多的同胞樣品)的優(yōu)點(diǎn)。傳遞不平衡檢驗(yàn)(TDT)是一個(gè)對(duì)連鎖的檢驗(yàn)李根,而不僅僅是連鎖不平衡槽奕。在連鎖存在的情況下,此法能有效地應(yīng)用于關(guān)聯(lián)分析房轿。

TDT是一個(gè)對(duì)連鎖的檢驗(yàn)粤攒,還是對(duì)連鎖不平衡所森,或同時(shí)對(duì)兩者的檢驗(yàn),曾經(jīng)是爭(zhēng)論的內(nèi)容(Hodges E, 1993;1994;suarezBKetal, 1994;spielmanRsetal, 1994;1996;EwensWJetal夯接,1995焕济。對(duì)這個(gè)問(wèn)題的解答依賴(lài)于樣本的特性;如果樣本由一組無(wú)關(guān)的病例及其雙親組成盔几,那么TDT同時(shí)是連鎖和連鎖不平衡的檢驗(yàn)(ShamPcetal,1995a)晴弃;另一方面,如果數(shù)據(jù)是由從一個(gè)大家系中獲得的逊拍,此家系中所有的患者都共享一個(gè)從一個(gè)共同的祖先遺傳下來(lái)的疾病等位基因上鞠,這種情況下TDT則是一個(gè)對(duì)連鎖的檢驗(yàn)⌒旧ィ總的來(lái)說(shuō)芍阎,TDT在所有情形下都是一個(gè)有效的連鎖不平衡檢驗(yàn),但對(duì)連鎖不平衡的敏感程度依賴(lài)于樣本中獨(dú)立的祖先疾病等位基因的數(shù)目缨恒。由于大多數(shù)用于TDT分析的樣本會(huì)包含許多單獨(dú)的家系谴咸,TDT可以被認(rèn)為是對(duì)連鎖的檢驗(yàn),而隨著連鎖不平衡程度的增加其效能也跟著增加骗露。一般情況下岭佳,當(dāng)通過(guò)病例一對(duì)照研究已經(jīng)揭示在人群水平上某標(biāo)記位點(diǎn)與某性狀(如疾病)間存在某種相關(guān)性(無(wú)論是真實(shí)還是虛假的關(guān)聯(lián))時(shí)萧锉,進(jìn)行傳遞不平衡檢驗(yàn)可以排除一些虛假關(guān)聯(lián)的結(jié)果珊随。通常在使用病例-對(duì)照研究確定存在關(guān)聯(lián),再使用這種方法進(jìn)一步檢驗(yàn)驹暑,從而排除病例對(duì)照研究中由于人群層化等因素造成的假陽(yáng)性結(jié)果。

TDT 以患者及生物學(xué)父母為研究對(duì)象辨赐,檢測(cè)雙親將某個(gè)遺傳標(biāo)記等位基因傳遞給受累后代是否表現(xiàn)為連鎖不平衡优俘。TDT 僅考慮遺傳標(biāo)記等位基因從雜合子父親或母親傳遞到受累后代的頻率,而且這些概率偏離 0.5 的情況也只發(fā)生在一種情況下掀序,即當(dāng)遺傳標(biāo)記等位基因和疾病基因位點(diǎn)之間既存在連鎖又存在等位基因關(guān)聯(lián)的時(shí)候(假設(shè)群體中標(biāo)記位點(diǎn)總體上不存在對(duì)孟德?tīng)柗蛛x的偏離)帆焕。

TDT原理如下:

famliy-based關(guān)聯(lián)分析優(yōu)勢(shì)

TDT只有在遺傳標(biāo)記和致病基因位點(diǎn)之間存在關(guān)聯(lián)關(guān)系的前提下才能檢測(cè)到連鎖,如果這個(gè)前提不成立不恭,那么TDT甚至不能檢測(cè)到緊密連鎖的兩個(gè)位點(diǎn)之間存在的連鎖關(guān)系叶雹,而傳統(tǒng)的連鎖分析方法不需要這個(gè)前提。與傳統(tǒng)的連鎖分析相比换吧,TDT的優(yōu)點(diǎn)折晦;1.對(duì)同樣的數(shù)據(jù),TDT比單倍型分析靈敏度更高沾瓦;2.TDT可以用于只有一個(gè)患者的簡(jiǎn)單核心家庭同時(shí)也可以用于有多個(gè)患者的大家系满着,對(duì)于患者數(shù)目不等的多個(gè)家系而言谦炒,TDT分析能直接將它們的數(shù)據(jù)合并進(jìn)行分析,不會(huì)造成統(tǒng)計(jì)上的復(fù)雜性风喇;3.TDT做為一個(gè)有效的連鎖檢驗(yàn)方法不依賴(lài)于任何遺傳模式宁改,雖然它對(duì)隱性遺傳模式較顯性遺傳模式更為有效;4.無(wú)論前提的關(guān)聯(lián)是由何種原因造成魂莫,無(wú)論層化現(xiàn)象存在與否还蹲,TDT分析都是對(duì)無(wú)連鎖(=1/2)假設(shè)的有效檢驗(yàn);5.當(dāng)遺傳標(biāo)記位點(diǎn)與致病基因位點(diǎn)相距很近或本身就是致病基因位點(diǎn)時(shí)耙考,TDT比傳統(tǒng)連鎖分析更能有效檢驗(yàn)出連鎖(Spileman RS et al谜喊,1996;ThomsonGSetal,1995;EwensWJetal琳骡,1995锅论。)當(dāng)樣本由無(wú)親緣關(guān)系的簡(jiǎn)單核心家庭組成時(shí),遺傳標(biāo)記等位基因傳遞獨(dú)立性的假設(shè)成立楣号,TDT分析(xZt動(dòng)還可以作為遺傳標(biāo)記與致病基因位點(diǎn)之間是否存在關(guān)聯(lián)的有效檢驗(yàn)(sPilemanRSetal最易,1996。與患者一正常對(duì)照模式的關(guān)聯(lián)分析相比炫狱,TDT分析檢測(cè)關(guān)聯(lián)的優(yōu)點(diǎn)藻懒;1.消除了患者一正常對(duì)照模式的關(guān)聯(lián)分析中患者群體和對(duì)照群體遺傳背景差異造成的影響,可完全消除種族分層引起的誤差视译;嬉荆;2.只有連鎖位點(diǎn)之間存在的關(guān)聯(lián)才能被檢測(cè)到;3.利用家庭關(guān)系可以對(duì)個(gè)體基因分型的準(zhǔn)確性進(jìn)行檢驗(yàn)酷含;4.父母各自對(duì)子代患者的影響可以區(qū)分開(kāi)來(lái)鄙早;5.可以利用家庭關(guān)系對(duì)相鄰的多個(gè)遺傳標(biāo)記構(gòu)建單倍型,并分析單倍型和疾病的關(guān)系(Thomson Gs etal, 1995)椅亚。

當(dāng)然限番,TDT分析也有其自身的局限性,由于一些疾病發(fā)病年齡較晚,親代資料很難收集,TDT分析結(jié)果同樣受到許多因素的影響,如;外顯率不全,表型模擬,遺傳異質(zhì)性呀舔,致病基因型相對(duì)危險(xiǎn)度(Genotypic relative risk, CRR)大小,致病基因和遺傳標(biāo)記等位基因頻率,致病基因突變位點(diǎn)出現(xiàn)的年代,遺傳標(biāo)記與致病基因位點(diǎn)之間起始連鎖不平衡程度大小弥虐,突變率和它們之間的重組率等。所以同樣需要大的樣本量才有利于嚴(yán)格意義的顯著性結(jié)果的發(fā)現(xiàn)(Xiong MM et al, 1998; AbelLet al, 1998; Schaid DJ, 1998媚赖。

family-based關(guān)聯(lián)分析缺點(diǎn)

①中老年發(fā)病患者中的雙親多已亡故霜瘪,而不易取得標(biāo)本;

②疾病異質(zhì)性將明顯降低相關(guān)分析的檢出率惧磺,按疾病病理生理性狀(又稱(chēng)中間性狀)分成亞組或直接研究中間性狀的相關(guān)位點(diǎn)颖对,將有助于解析疾病的易感位點(diǎn);

③由于外顯不全磨隘,發(fā)病晚惜互,對(duì)照群體內(nèi)可存在尚未發(fā)病的個(gè)體布讹,導(dǎo)致影響檢出率;

④由于對(duì)遺傳標(biāo)記的雜合度要求較高训堆,雙親必須是雜合子才能進(jìn)行TDT分析描验,故SNP標(biāo)記在TDT分析中較難發(fā)揮作用。

famliy-based關(guān)聯(lián)分析一般流程

?????? 1)選擇樣本坑鱼,確定分析群體膘流。Family-based關(guān)聯(lián)分析樣本是患者及其生物學(xué)父母

?????? 2)收集樣本的表型,注意疾病亞型區(qū)分

?????? 3)對(duì)樣本基因基因分型

?????? 4)標(biāo)記過(guò)濾鲁沥,除了去除低質(zhì)量呼股、缺失率高的標(biāo)記外還要去除不符合哈迪溫伯格平衡的標(biāo)記

?????? 5)傳遞不平衡檢測(cè)

Family-based關(guān)聯(lián)分析軟件

1UNPHASED

軟件特性:

?? Analysisof nuclear families and unrelated subjects, and combinations of the two

?? Analysisof discrete or quantitative traits

?? Maximumlikelihood treatment of missing genotype data and uncertain haplotypes

?? Globalassociation tests and tests of individual haplotypes

?? Conditioningtests that allow for previous associations of linked loci

?? Inclusionof information from additional tag markers

?? Supportfor non-genetic covariates including parent-of-origin

?? Permutationtests allowing for multiple testing

軟件鏈接:https://sites.google.com/site/fdudbridge/software/unphased-3-1

參考文獻(xiàn):Dudbridge F (2008) Likelihood-based association analysis for nuclear families and unrelated subjects with missing genotype data. Hum Hered 66:87-98(606次引用)

2Polyunphased

Unphased的升級(jí)版,也是基于C++寫(xiě)的画恰,有命令行和JAVA界面兩種操作彭谁。相比于Unphased可以同時(shí)分析雙歧表型(如某一疾病存在亞表型)。

軟件路徑:https://github.com/abureau/polyUnphased

參考文獻(xiàn):Polyunphased:an extension to polytomous outcomes of the?Unphased?package forfamily-based genetic association analysis.

3FBAT776

采用McNeman檢驗(yàn)允扇,F(xiàn)BAT軟件不足:未提供等位基因傳遞與未傳遞的數(shù)值缠局;

參考文獻(xiàn):

Implementing a unified approach to family‐based tests of association. NM Laird,?S Horvath, X Xu?- Genetic epidemiology, 2000 - Wiley Online Library(被引914)

S Horvath, X Xu,NM Laird. The family based?association test method: strategies for studying general genotype–phenotype associations. European Journal of Human Genetics, 2001 (被引776)

軟件路徑:https://content.sph.harvard.edu/fbat/default.html

4)PBAT

FBAT的升級(jí)版,PBAT可以計(jì)算power考润、可用于數(shù)量性狀狭园、也可以同時(shí)做多個(gè)性狀/標(biāo)記/模型

下載路徑:https://www.hsph.harvard.edu/pbat/download/

5)PLINK

采用McNeman檢驗(yàn),PLINK軟件的不足是未提供信息家系數(shù)糊治。當(dāng)信息家系親代傳遞和未傳遞給患兒的等位基因數(shù)之和小于40時(shí)唱矛,PLINK軟件的perm選項(xiàng)可提供確切概率

軟件鏈接:http://zzz.bwh.harvard.edu/plink/fanal.shtml

6)TRANSMIT

該軟件通過(guò)分析遺傳標(biāo)記等位基因從父母到子代患者的傳遞情況來(lái)檢驗(yàn)該遺傳標(biāo)記與疾病位點(diǎn)之間的關(guān)聯(lián)情況,其主要的有點(diǎn)在于它能夠分析由多個(gè)位點(diǎn)等位基因所構(gòu)成的單體型從父母到子代的傳遞情況井辜,即使在基因型相位未知或少量父母基因型缺失的情況下绎谦。

7)Mendel

Mendel是一個(gè)包含個(gè)分析選項(xiàng)主要采的復(fù)合程序包,可對(duì)數(shù)量和質(zhì)量遺傳性狀進(jìn)行統(tǒng)計(jì)分析。Mendel軟件可以提供多個(gè)等位基因(如STR標(biāo)記)的TDT檢驗(yàn)粥脚。Mendel提供了兩種類(lèi)似的運(yùn)算方法,分別命名為T(mén)DT1(chi-sequare TDT statistic)和TDT2(largest standerdized residual TDT statistic)

除此之外還有:GENEHUNTER, UNPHASE,ASPEX

*原創(chuàng)文字窃肠,如果覺(jué)得對(duì)你有幫助留下你的贊哦~*

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市阿逃,隨后出現(xiàn)的幾起案子铭拧,更是在濱河造成了極大的恐慌赃蛛,老刑警劉巖恃锉,帶你破解...
    沈念sama閱讀 216,324評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異呕臂,居然都是意外死亡破托,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)歧蒋,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)土砂,“玉大人州既,你說(shuō)我怎么就攤上這事÷苡常” “怎么了吴叶?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,328評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)序臂。 經(jīng)常有香客問(wèn)我蚌卤,道長(zhǎng),這世上最難降的妖魔是什么奥秆? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,147評(píng)論 1 292
  • 正文 為了忘掉前任逊彭,我火速辦了婚禮,結(jié)果婚禮上构订,老公的妹妹穿的比我還像新娘侮叮。我一直安慰自己,他們只是感情好悼瘾,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,160評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布囊榜。 她就那樣靜靜地躺著,像睡著了一般分尸。 火紅的嫁衣襯著肌膚如雪锦聊。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,115評(píng)論 1 296
  • 那天箩绍,我揣著相機(jī)與錄音孔庭,去河邊找鬼。 笑死材蛛,一個(gè)胖子當(dāng)著我的面吹牛圆到,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播卑吭,決...
    沈念sama閱讀 40,025評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼芽淡,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了豆赏?” 一聲冷哼從身側(cè)響起挣菲,我...
    開(kāi)封第一講書(shū)人閱讀 38,867評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎掷邦,沒(méi)想到半個(gè)月后白胀,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,307評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡抚岗,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,528評(píng)論 2 332
  • 正文 我和宋清朗相戀三年或杠,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片宣蔚。...
    茶點(diǎn)故事閱讀 39,688評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡向抢,死狀恐怖认境,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情挟鸠,我是刑警寧澤叉信,帶...
    沈念sama閱讀 35,409評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站艘希,受9級(jí)特大地震影響茉盏,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜枢冤,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,001評(píng)論 3 325
  • 文/蒙蒙 一鸠姨、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧淹真,春花似錦讶迁、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,657評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至客扎,卻和暖如春祟峦,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背徙鱼。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,811評(píng)論 1 268
  • 我被黑心中介騙來(lái)泰國(guó)打工宅楞, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人袱吆。 一個(gè)月前我還...
    沈念sama閱讀 47,685評(píng)論 2 368
  • 正文 我出身青樓厌衙,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親绞绒。 傳聞我的和親對(duì)象是個(gè)殘疾皇子婶希,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,573評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容