基因型和表型概念
基因型(Genotype):指某一生物體全部基因信息的總稱峡迷,反映生物體的遺傳構(gòu)成护蝶,遺傳學(xué)中具體使用的基因型往往是指某一性狀的基因型
表型(Phenotype):具有特定基因型的個(gè)體,在一定環(huán)境條件下烛卧,所表現(xiàn)出來(lái)的性狀特征(形態(tài)、結(jié)構(gòu)、生理绞佩、生化、行為等)或疾病狀態(tài)
表型 = 基因型 + 環(huán)境
GWAS基本概念
全基因組關(guān)聯(lián)分析(Genome-wide Association Study, GWAS),是研究復(fù)雜表型性狀關(guān)聯(lián)基因變異的方法猪钮,通過(guò)對(duì)照分析或相關(guān)性分析品山,在全基因組范圍內(nèi)找出存在的序列變異,從中篩選出與復(fù)雜表型性狀相關(guān)的基因變異烤低。
傳統(tǒng)單基因遺傳的研究方法:利用家系連鎖分析的定位克隆方法肘交,發(fā)現(xiàn)了大量單基因疾病和單基因遺傳性狀
GWAS的優(yōu)勢(shì)
可以對(duì)多個(gè)個(gè)體在全基因組范圍的遺傳變異(標(biāo)記)多態(tài)性進(jìn)行檢測(cè),獲得基因型扑馁;將基因型與可觀測(cè)的性狀涯呻,即表型,進(jìn)行群體水平的統(tǒng)計(jì)學(xué)分析腻要;根據(jù)統(tǒng)計(jì)量或顯著性P值篩選出最有可能影響該性狀的遺傳變異(標(biāo)記)复罐,挖掘與性狀變異相關(guān)的基因。同時(shí)GWAS的分辨率高(單堿基水平)雄家,而且研究材料來(lái)源廣泛效诅,可捕獲的變異豐富,并且節(jié)省時(shí)間趟济。
GWAS背后的技術(shù)
基因型檢測(cè)---芯片與測(cè)序
基因芯片技術(shù):高通量分型
全基因組測(cè)序技術(shù):高通量低成本
GWAS jargon
Locus - genetic position on a chromosome, and a single base pair positon in the context of SNPs
SNP - a locus(single base pair) that exhibits variation in a population
Allele - (in the context of SNPs) - the alternative forms of a nucleotide at a particular locus
Genotype - the pair of alleles at a locus, one paternal and one maternal
Haplotype - a group of SNPs that are inherited jointly from a parent (單倍型)
Linkage disequilibrium - alleles at multiple loci that exhibit a dependence (nonrandom association)
GWAS研究基礎(chǔ)
定義復(fù)雜性狀的表型乱投,盡可能選擇可定量反映疾病危險(xiǎn)程度的指標(biāo)、可用于分析疾病臨床亞型的特征顷编、或可用于診斷鑒別疾病的表型特征
高密度分子遺傳標(biāo)記:包括SNP戚炫、Indel、CNV等
GWAS適用數(shù)量性狀和質(zhì)量性狀
數(shù)量性狀:多基因控制媳纬,能夠測(cè)量得到具體數(shù)值嘹悼,符合正態(tài)分布;考慮到數(shù)量性狀受環(huán)境影響大层宫,建議將所有材料在同一環(huán)境下培育或養(yǎng)殖杨伙,或者用多年多點(diǎn)的數(shù)據(jù)分開(kāi)分析后綜合結(jié)果或取BLUP(bese linear unbiased prediction)值作為性狀值進(jìn)行關(guān)聯(lián)分析
質(zhì)量性狀:單基因控制,無(wú)法用具體數(shù)值來(lái)衡量萌腿,可轉(zhuǎn)換為0限匣、1等表示,需要注意的是每個(gè)群體選取近似的樣本
分級(jí)性狀:表型分布類似質(zhì)量性狀,但實(shí)際受多基因控制(數(shù)量性狀)米死,如抗性性狀锌历,因此需要提供每一個(gè)個(gè)體精確的測(cè)量數(shù)據(jù)
多指標(biāo)性狀:有多個(gè)指標(biāo)可以同時(shí)度量時(shí),找出代表原表型數(shù)據(jù)變異的主成分因子峦筒,作為關(guān)聯(lián)分析的表型數(shù)據(jù)
全基因組關(guān)聯(lián)分析--研究方式
1究西、GWAS技術(shù)通過(guò)比較無(wú)關(guān)個(gè)體:(1)患者和正常人群;(2)隨機(jī)人群隊(duì)列的基因組多態(tài)位點(diǎn)物喷,找出疾病特異性的遺傳標(biāo)記卤材,從而識(shí)別出某種疾病或表型的發(fā)病機(jī)制或相關(guān)位點(diǎn)。理論上峦失,檢測(cè)到的多態(tài)位點(diǎn)越多扇丛,識(shí)別關(guān)鍵位點(diǎn)的可能性就越大
2、單階段和多階段:(單階段)選擇足夠的樣本,一次性在所有研究對(duì)象中對(duì)選中的SNP進(jìn)行基因分型,然后分析每個(gè)SNP和疾病/性狀的關(guān)聯(lián)意鲸,早期的GWAS研究中應(yīng)用較多贩幻;(多階段)以個(gè)體為單位,也可以采用DNA pooling的方法,篩選出較少量的陽(yáng)性SNP,第二階段采用更大的樣本集對(duì)第一階段篩選出的陽(yáng)性SNP進(jìn)行分析。
GWAS統(tǒng)計(jì)分析方法
1)Each SNP is an independent test (每一個(gè)SNP都要進(jìn)行獨(dú)立的檢驗(yàn))
2)Associations are tested by comparing the frequency of each allele in cases and controls
3)Odds ratio:(比值比/優(yōu)勢(shì)比)strength of association. It is a measure of effect size, or strength of association
odds = P/(1-P) . For example , if probability of winning is 50%, odds is 0.5/(1-0.5) = 1; if probaility of winning is 75%, odds is 0.75/(1-0.75) = 3.
OR = 1 , no association
OR > 1, allele T increases risk
OR < 1, allele G increases risk
4)P - value :chi-square test
多重檢驗(yàn)矯正(Multiple Hypothesis Testing)
Correction?for?multiple?testing
The false discovery rate(FDR)
The Bonferroni correction
連鎖不平衡(Linkage disequilibrium)
群體內(nèi)不同位點(diǎn)等位基因間的非隨機(jī)性組合的關(guān)系昆庇,即當(dāng)位于同一染色體的兩個(gè)基因座(A,B)基因型同時(shí)存在的概率闸溃,大于群體中因隨機(jī)分布而同時(shí)出現(xiàn)的概率時(shí)整吆,就稱這兩個(gè)點(diǎn)處于LD狀態(tài)。如果A和B存在著顯著的連鎖不平衡辉川,那么B就可以作為A的標(biāo)記表蝙。
GWAS study design
* 首先是發(fā)現(xiàn)的SNP信息隨著sample的增加也是顯著增加的。如果是針對(duì)疾病做研究的話乓旗,那就可以將樣本分為case組和control組府蛇。如果是針對(duì)某個(gè)性狀做研究的話,就可以不用去分
* 對(duì)基因型進(jìn)行獲取屿愚,分別有芯片和全基因組測(cè)序的方法汇跨。
* 然后可以做一些SNP的分析,例如曼哈頓圖這一類的統(tǒng)計(jì)檢驗(yàn)妆距,看這些SNP是在哪個(gè)染色體上是比較significant
* 之后就可以找一些連鎖不平衡的Block
GWAS局限性
GWAS是一種發(fā)現(xiàn)符合“常見(jiàn)疾病-常見(jiàn)變異假說(shuō)”相關(guān)位點(diǎn)的方法穷遂,其可以確定相關(guān)位點(diǎn),但不能直接確定基因本身娱据,且在任何特定人群中GWAS都不能方便的識(shí)別罕見(jiàn)的風(fēng)險(xiǎn)等位基因位點(diǎn)蚪黑。
EWAS(Epigenome - wide assciation study, 表觀基因組關(guān)聯(lián)分析)
與GWAS形成互補(bǔ),將表觀遺傳學(xué)變異和復(fù)雜疾病或性狀進(jìn)行關(guān)聯(lián),將表觀遺傳學(xué)層面對(duì)復(fù)雜疾病的致病原因或性狀關(guān)聯(lián)進(jìn)行解讀忌穿,找到與致病原因相關(guān)或復(fù)雜性狀相關(guān)的表觀遺傳學(xué)變異位點(diǎn)抒寂。
通過(guò)檢測(cè)整個(gè)基因組成千上萬(wàn)特異表觀修飾差異(比如DNA核苷酸上甲基分布),來(lái)鑒別出疾病中常見(jiàn)的表觀突變或與復(fù)雜性狀密切相關(guān)的表觀修飾
DNA甲基化是表觀組關(guān)聯(lián)研究的熱點(diǎn)
* Dynamic Nature(動(dòng)態(tài)性):絕大多數(shù)環(huán)境和行為因素都能影響DNA甲基化
* Quantitative Accuracy(定量準(zhǔn)確):DNA甲基化的定量能達(dá)到1%分辨率
* Reversibility(可逆性):受環(huán)境或行為影響發(fā)生的DNA甲基化改變具有可逆性