概念
基因型(Genotype):指某一生物體全部基因信息的總稱,反映生物體的遺傳構(gòu)成攀唯,遺傳學(xué)中具體使用的基因型往往是指某一性狀的基因型
表型(Phenotype):具有特定基因型的個(gè)體,在一定環(huán)境條件下,所表現(xiàn)出來的性狀特征(形態(tài)啊掏、結(jié)構(gòu)、生理衰猛、生化迟蜜、行為等)或疾病狀態(tài)
表型 = 基因型 + 環(huán)境
GWAS
全基因組關(guān)聯(lián)分析(Genome-wide Association Study, GWAS),是研究復(fù)雜表型性狀關(guān)聯(lián)基因變異的方法,通過對(duì)照分析或相關(guān)性分析啡省,在全基因組范圍內(nèi)找出存在的序列變異娜睛,從中篩選出與復(fù)雜表型性狀相關(guān)的基因變異髓霞。
傳統(tǒng)單基因遺傳的研究方法:利用家系連鎖分析的定位克隆方法,發(fā)現(xiàn)了大量單基因疾病和單基因遺傳性狀
GWAS的優(yōu)勢(shì):可以對(duì)多個(gè)個(gè)體在全基因組范圍的遺傳變異(標(biāo)記)多態(tài)性進(jìn)行檢測(cè)畦戒,獲得基因型方库;將基因型與可觀測(cè)的性狀,即表型障斋,進(jìn)行群體水平的統(tǒng)計(jì)學(xué)分析纵潦;根據(jù)統(tǒng)計(jì)量或顯著性P值篩選出最有可能影響該性狀的遺傳變異(標(biāo)記),挖掘與性狀變異相關(guān)的基因垃环。同時(shí)GWAS的分辨率高(單堿基水平)邀层,而且研究材料來源廣泛,可捕獲的變異豐富遂庄,并且節(jié)省時(shí)間寥院。
GWAS背后的技術(shù)
基因型檢測(cè)---芯片與測(cè)序
基因芯片技術(shù):高通量分型
全基因組測(cè)序技術(shù):高通量低成本
GWAS jargon
Locus - genetic position on a chromosome, and a single base pair positon in the context of SNPs
SNP - a locus(single base pair) that exhibits variation in a population
Allele - (in the context of SNPs) - the alternative forms of a nucleotide at a particular locus
Genotype - the pair of alleles at a locus, one paternal and one maternal
Haplotype - a group of SNPs that are inherited jointly from a parent (單倍型)
Linkage disequilibrium - alleles at multiple loci that exhibit a dependence (nonrandom association)
GWAS適用數(shù)量性狀和質(zhì)量性狀
數(shù)量性狀:多基因控制,能夠測(cè)量得到具體數(shù)值涛目,符合正態(tài)分布秸谢;考慮到數(shù)量性狀受環(huán)境影響大,建議將所有材料在同一環(huán)境下培育或養(yǎng)殖霹肝,或者用多年多點(diǎn)的數(shù)據(jù)分開分析后綜合結(jié)果或取BLUP(bese linear unbiased prediction)值作為性狀值進(jìn)行關(guān)聯(lián)分析
質(zhì)量性狀:單基因控制估蹄,無法用具體數(shù)值來衡量,可轉(zhuǎn)換為0沫换、1等表示元媚,需要注意的是每個(gè)群體選取近似的樣本
分級(jí)性狀:表型分布類似質(zhì)量性狀,但實(shí)際受多基因控制(數(shù)量性狀)苗沧,如抗性性狀,因此需要提供每一個(gè)個(gè)體精確的測(cè)量數(shù)據(jù)
多指標(biāo)性狀:有多個(gè)指標(biāo)可以同時(shí)度量時(shí)炭晒,找出代表原表型數(shù)據(jù)變異的主成分因子待逞,作為關(guān)聯(lián)分析的表型數(shù)據(jù)
全基因組關(guān)聯(lián)分析--研究方式
1、GWAS技術(shù)通過比較無關(guān)個(gè)體:(1)患者和正常人群网严;(2)隨機(jī)人群隊(duì)列的基因組多態(tài)位點(diǎn)识樱,找出疾病特異性的遺傳標(biāo)記,從而識(shí)別出某種疾病或表型的發(fā)病機(jī)制或相關(guān)位點(diǎn)震束。理論上怜庸,檢測(cè)到的多態(tài)位點(diǎn)越多,識(shí)別關(guān)鍵位點(diǎn)的可能性就越大
2垢村、單階段和多階段:(單階段)選擇足夠的樣本割疾,一次性在所有研究對(duì)象中對(duì)選中的SNP進(jìn)行基因分型,然后分析每個(gè)SNP和疾病/性狀的關(guān)聯(lián)嘉栓,早期的GWAS研究中應(yīng)用較多宏榕;(多階段)以個(gè)體為單位拓诸,也可以采用DNA pooling的方法,篩選出較少量的陽性SNP麻昼,第二階段采用更大的樣本集對(duì)第一階段篩選出的陽性SNP進(jìn)行分析奠支。
GWAS統(tǒng)計(jì)分析方法
1)Each SNP is an independent test (每一個(gè)SNP都要進(jìn)行獨(dú)立的檢驗(yàn))
2)Associations are tested by comparing the frequency of each allele in cases and controls
3)Odds ratio:(比值比/優(yōu)勢(shì)比)strength of association. It is a measure of effect size, or strength of association
odds = P/(1-P) . For example , if probability of winning is 50%, odds is 0.5/(1-0.5) = 1; if probaility of winning is 75%, odds is 0.75/(1-0.75) = 3.
OR = 1 , no association
OR > 1, allele T increases risk
OR < 1, allele G increases risk
4)P - value :chi-square test
多重檢驗(yàn)矯正(Multiple Hypothesis Testing)
Correction?for?multiple?testing
The false discovery rate(FDR)
The Bonferroni correction
連鎖不平衡(Linkage disequilibrium)
群體內(nèi)不同位點(diǎn)等位基因間的非隨機(jī)性組合的關(guān)系,即當(dāng)位于同一染色體的兩個(gè)基因座(A抚芦,B)基因型同時(shí)存在的概率倍谜,大于群體中因隨機(jī)分布而同時(shí)出現(xiàn)的概率時(shí),就稱這兩個(gè)點(diǎn)處于LD狀態(tài)叉抡。如果A和B存在著顯著的連鎖不平衡尔崔,那么B就可以作為A的標(biāo)記。(也可以這樣理解:是指在某一群體中卜壕,不同座位上某兩個(gè)基因同時(shí)遺傳的頻率明顯高于預(yù)期的隨機(jī)頻率的現(xiàn)象您旁。簡(jiǎn)單的說,只要兩個(gè)基因不是完全獨(dú)立的遺傳轴捎,就會(huì)表現(xiàn)出某種程度的連鎖鹤盒,這種情況就叫做連鎖不平衡。連鎖不平衡可以是同一染色體上的不同區(qū)域侦副,也可以是不同染色體上的 )
GWAS study design
1侦锯、首先是發(fā)現(xiàn)的SNP信息隨著sample的增加也是顯著增加的。如果是針對(duì)疾病做研究的話秦驯,那就可以將樣本分為case組和control組尺碰。如果是針對(duì)某個(gè)性狀做研究的話,就可以不用去分
2译隘、對(duì)基因型進(jìn)行獲取亲桥,分別有芯片和全基因組測(cè)序的方法。
3固耘、然后可以做一些SNP的分析题篷,例如曼哈頓圖這一類的統(tǒng)計(jì)檢驗(yàn),看這些SNP是在哪個(gè)染色體上是比較significant
4厅目、之后就可以找一些連鎖不平衡的Block
GWAS局限性
GWAS是一種發(fā)現(xiàn)符合“常見疾病-常見變異假說”相關(guān)位點(diǎn)的方法番枚,其可以確定相關(guān)位點(diǎn),但不能直接確定基因本身损敷,且在任何特定人群中GWAS都不能方便的識(shí)別罕見的風(fēng)險(xiǎn)等位基因位點(diǎn)葫笼。
EWAS
(Epigenome - wide assciation study, 表觀基因組關(guān)聯(lián)分析),與GWAS形成互補(bǔ)拗馒,將表觀遺傳學(xué)變異和復(fù)雜疾病或性狀進(jìn)行關(guān)聯(lián)路星,將表觀遺傳學(xué)層面對(duì)復(fù)雜疾病的致病原因或性狀關(guān)聯(lián)進(jìn)行解讀,找到與致病原因相關(guān)或復(fù)雜性狀相關(guān)的表觀遺傳學(xué)變異位點(diǎn)诱桂。通過檢測(cè)整個(gè)基因組成千上萬特異表觀修飾差異(比如DNA核苷酸上甲基分布)奥额,來鑒別出疾病中常見的表觀突變或與復(fù)雜性狀密切相關(guān)的表觀修飾
表觀組關(guān)聯(lián)研究的熱點(diǎn)--DNA甲基化
Dynamic Nature(動(dòng)態(tài)性):絕大多數(shù)環(huán)境和行為因素都能影響DNA甲基化
Quantitative Accuracy(定量準(zhǔn)確):DNA甲基化的定量能達(dá)到1%分辨率
Reversibility(可逆性):受環(huán)境或行為影響發(fā)生的DNA甲基化改變具有可逆性