一勇蝙、個(gè)體對(duì)群體遺傳組成的影響
生物進(jìn)化是群體遺傳組成隨著時(shí)間的變化而變化沫勿。我們的群體由不同的雜交個(gè)體組成,其遺傳組成由每個(gè)個(gè)體攜帶的基因組組成。由于個(gè)體死亡或個(gè)體進(jìn)出人口的遷移藕帜,造成群體遺傳組成的變化烫罩。如果群體中的個(gè)體數(shù)量不同,也會(huì)影響下一代群體的構(gòu)成洽故。群體中的每個(gè)新個(gè)體都會(huì)不同程度地影響群體的基因構(gòu)成。個(gè)體的基因組是父母親基因組的獨(dú)特組合的結(jié)果盗誊,在減數(shù)分裂過(guò)程中被隔離和重組时甚,并且可能因突變而進(jìn)一步產(chǎn)生變異。這些個(gè)體的個(gè)別變異對(duì)整個(gè)群體的影響可能很小哈踱,但是它是所有的個(gè)體和其世代子孫中基因的微小變化的積累荒适,是推動(dòng)進(jìn)化的最基本的因素。正是數(shù)十开镣,數(shù)百和數(shù)百萬(wàn)代人的這些微小變化刀诬,推動(dòng)了地球產(chǎn)生了驚人的物種多樣性。
二邪财、群體遺傳學(xué)的定義
群體遺傳學(xué)是研究自然群體的遺傳組成及其進(jìn)化的原因和結(jié)果陕壹。定量遺傳學(xué)是研究表型變異的遺傳基礎(chǔ)以及表型變化如何隨時(shí)間演變。這兩個(gè)領(lǐng)域都在概念上緊密相關(guān)树埠,都是通過(guò)描述如何經(jīng)過(guò)突變糠馆,重組,選擇怎憋,遷移和遺傳漂移來(lái)改變種群的遺傳和表型組成又碌。 群體遺傳學(xué)通過(guò)預(yù)測(cè)逐漸積累群體內(nèi)部和群體之間的進(jìn)化變化,可以很好地理解短期演化變化和生物多樣性的長(zhǎng)期演變绊袋。隨著進(jìn)化思想的蓬勃發(fā)展毕匀,現(xiàn)代群體遺傳學(xué)融合了了基因組學(xué),系統(tǒng)發(fā)育學(xué)癌别,生態(tài)學(xué)和發(fā)育生物學(xué)皂岔,為解析地球的進(jìn)化史提供了的新見解。
三规个、基礎(chǔ)概念
基因座(locus/loci):基因組中特定的位點(diǎn)凤薛。基因座可以是可能是完整基因或單個(gè)核苷酸堿基對(duì)诞仓,如A-T缤苫。
等位基因(Alleles):在每個(gè)基因座中,通過(guò)突變產(chǎn)生的兩種或更多種基因的替代形式墅拭,并且都存在于染色體上的相同位置中活玲。等位基因可以進(jìn)一步分為主要的等位基因(major alleles)和次要等位基因(minor alleles),這兩個(gè)概念顧名思義就是根據(jù)等位基因出現(xiàn)的頻率來(lái)定,還記得我們平時(shí)用來(lái)過(guò)濾SNP的MAF條件嗎舒憾?其實(shí)MAF就是次要等位基因的出現(xiàn)頻率镀钓。
單一同態(tài)性的(monomorphic):如果一個(gè)群體中的所有個(gè)體都有相同的等位基因,可以稱這個(gè)基因座是具有單一同態(tài)性镀迂。
多態(tài)性(polymorphic):如果一個(gè)基因座中存在多個(gè)不同的等位基因丁溅,我們可以將這個(gè)基因座成為是具有多態(tài)性的。
同義替代(synonymous substitution):在編碼蛋白質(zhì)的基因的外顯子中探遵,一個(gè)堿基與另一個(gè)堿基的進(jìn)化取代窟赏,使得產(chǎn)生的氨基酸序列不變。
非同義替代(non-synonymous substitution):是改變蛋白質(zhì)的氨基酸序列的核苷酸突變箱季。
單倍型(haplotype):在同一染色體上進(jìn)行共同遺傳的多個(gè)基因座上等位基因的組合涯穷;通俗的說(shuō)法就是若干個(gè)決定同一性狀的緊密連鎖的基因構(gòu)成的基因型。按照某一指定基因座上基因重組發(fā)生的數(shù)量藏雏,單倍型甚至可以指至少兩個(gè)基因座或整個(gè)染色體拷况。
傳統(tǒng)群體遺傳學(xué)是基于觀察到的等位基因頻率與預(yù)期頻率的分析。例如掘殴,在Wright-Fisher模型下赚瘦,你可能會(huì)看到有性繁殖的二倍體個(gè)體群體,而且這些種群沒有重疊世代杯巨。該模型忽略了諸如突變蚤告,重組,選擇或種群大小或結(jié)構(gòu)變化等影響服爷。更復(fù)雜的模型可以包含在實(shí)際群體中觀察到的影響的不同方面杜恰。然而,大多數(shù)這些模型都假設(shè)群體是以性方式繁殖的仍源。
群體:是指生活在一定空間范圍內(nèi)心褐,能夠相互交配并生育具有正常生殖能力后代的同種個(gè)體群。群體與個(gè)體相對(duì)笼踩,是個(gè)體的共同體逗爹,不同個(gè)體按某種特征結(jié)合在一起,進(jìn)行共同活動(dòng)嚎于、相互交往掘而,就形成了群體。
有效群體大杏诠骸:指與實(shí)際群體有相同基因頻率方差或相同雜合度衰減率的理想群體含量袍睡,通常小于絕對(duì)的群體大小。
A locus (基因座):是基因組中的一個(gè)位置肋僧,我們可以在不同的個(gè)體中觀察一個(gè)或幾個(gè)等位基因斑胜。假定群體遺傳學(xué)中使用的基因座是選擇性中性的控淡,可以是anonymous或非編碼區(qū),如微衛(wèi)星基因座(SSR)止潘,單核苷酸多態(tài)性(SNP)掺炭。
A genotytpe (基因型):是特定基因座上給定個(gè)體攜帶的等位基因的組合。攜帶同一組等位基因的個(gè)體被認(rèn)為具有相同的多基因座基因型 (MLG)凭戴。
基因型頻率:,群體中某一基因型個(gè)體占群體總個(gè)數(shù)的比例涧狮。可以反映某一基因型個(gè)體在群體中的相對(duì)數(shù)量么夫。在群體遺傳學(xué)中基因型頻率指在一個(gè)種群中某種基因型的所占的百分比勋篓。
群體中基本度量標(biāo)準(zhǔn)是多態(tài)性,等位基因頻率和基因型頻率魏割。多態(tài)性可以通過(guò)多種方式進(jìn)行估計(jì),例如觀察到的多個(gè)等位基因的總數(shù)钢颂。
等位基因頻率:是群體遺傳學(xué)的術(shù)語(yǔ)钞它,用來(lái)顯示一個(gè)種群中基因的多樣性,或者說(shuō)是基因庫(kù)的豐富程度殊鞭。在一個(gè)群體中遭垛,等位基因頻率即某類等位基因占該基因位點(diǎn)上全部等位基因數(shù)的比率。如:在某種群中一個(gè)等位基因的基因頻率為20%操灿,那么在種群的所有成員中锯仪,1/5的染色體帶有那個(gè)等位基因,而其他4/5的染色體帶有該等位基因的其他對(duì)應(yīng)變種—可以是一種也可以是很多種趾盐。
遺傳平衡定律(哈迪-溫伯格定律):是指在理想狀態(tài)下庶喜,各等位基因的頻率和等位基因的基因型頻率在遺傳中是穩(wěn)定不變的,即保持著基因平衡救鲤。例:當(dāng)?shù)任换蛑挥幸粚?duì)(Aa)時(shí)久窟,設(shè)基因A的頻率為p,基因a的頻率為q本缠,則A+a=p+q=1斥扛,AA+Aa+aa=p2+2pq+q2=1。哈迪-溫伯格平衡定律(Hardy-Weinberg equilibrium) 對(duì)于一個(gè)大且隨機(jī)交配的種群丹锹,基因頻率和基因型頻率在沒有遷移稀颁、突變和選擇的條件下會(huì)保持不變。
四楣黍、群體分析
群體分析一般可以分為匾灶,分層分析和選擇分析。分層分析可以定義為锡凝,基于群體內(nèi)個(gè)體之間基因序列上的差異粘昨。群體選擇分析是在群體水平在基因組不同區(qū)域遺傳多樣性的差異垢啼。
1. 分層分析
- 系統(tǒng)發(fā)育研究:一般使用發(fā)育樹研究具有共同祖先之間進(jìn)化關(guān)系,探究物種進(jìn)化的關(guān)系和分類的關(guān)系张肾。
- PCA(主成分分析):用較少不相關(guān)的變量替代原始大量相關(guān)的變量芭析,來(lái)研究群體分層,亞種之前的進(jìn)化關(guān)系吞瞪。
- 群體結(jié)構(gòu)分析:研究大群體中存在基因頻率不同的亞群馁启,一般可以用來(lái)推斷祖先群,個(gè)體血緣組成芍秆,還有雜交事件惯疙。
2. 選擇分析
選擇清除分析:自然選擇促使有利突變?cè)谌后w中保留下來(lái),與之連鎖的中性位點(diǎn)突變頻率提升妖啥,非連鎖的中性位點(diǎn)突變頻率下降霉颠;簡(jiǎn)單的說(shuō)就是基因組某區(qū)域由于受到了選擇而消除多態(tài)性,即遺傳多樣性降低荆虱,在群體中出現(xiàn)高頻的等位基因和低頻的等位基因蒿偎。主要用于:挖掘馴化過(guò)程中受選擇的基因和挖掘物種適應(yīng)性進(jìn)化過(guò)程中受選擇的基因。
適合度-分析:是指生物體或生物群體對(duì)環(huán)境適應(yīng)的量化特征怀读,是分析估計(jì)生物所具有的各種特征的適應(yīng)性诉位,以及在進(jìn)化過(guò)程中繼續(xù)往后代傳遞的能力的指標(biāo)。適合度是衡量一個(gè)個(gè)體存活和繁殖成功機(jī)會(huì)的尺度菜枷。適合度越大苍糠,個(gè)體成活的機(jī)會(huì)和繁殖成功的機(jī)會(huì)也越大,反之則相反(因此義項(xiàng)與廣義適合度相對(duì)應(yīng)啤誊,故亦可稱之為狹義適合度)岳瞭。
計(jì)算方式:適合度可以用數(shù)據(jù)計(jì)算出來(lái):W=ml。其中坷衍,W代表適合度寝优,m表示基因型個(gè)體生育力,l表示基因型個(gè)體存活率枫耳。
常用的統(tǒng)計(jì)方法:
θπ乏矾、θW,Tajima's D迁杨,F(xiàn)st钻心。
θπ:群體中任意兩條不同序列(個(gè)體)的堿基差異數(shù)(SNP)取平均值。
- 手人工選擇的群體铅协,遺傳多樣性相對(duì)單一捷沸,θπ值較小
- 野生群體遺傳多樣性大,θπ值比較大
- 單個(gè)群體內(nèi)部基因型多樣性(0-1)狐史,多樣性越大舶替,θπ越大。
θW:基于全部序列內(nèi)分離位點(diǎn)個(gè)數(shù)
中性檢驗(yàn)(Tajima's D):
Tajima’D = (θπ–θW)/Var(θπ–θW)
- θπ = θw Tajima's D = 0胖笛,中性進(jìn)化;
- θπ < θw Tajima’s D < 0:群體中存在許多低頻率的等位基因(稀有等位基因)尼斧,則θW增大而θT不受影響(或影響較小)试吁,由定向選擇或群體擴(kuò)張引起棺棵;
- θπ > θw Tajima’s D > 0:群體中高等/中等頻率的等位基因較多, θT增大而θW 不受影響熄捍,由于平衡選擇和瓶頸效應(yīng)引起的烛恤。
平衡選擇與定向選擇都屬于正選擇的范疇,因此余耽,只要D值顯著背離0缚柏,就可能是自然選擇的結(jié)果;而當(dāng)D值不顯著背離0時(shí)碟贾,則中性突變船惨。
Fst:群體間遺傳分化指數(shù),是種群分化和遺傳距離的一種衡量方法缕陕,分化指數(shù)越大,差異越大疙挺。
Fst= (πBetween-πWithin)/πBetween
πBetween:來(lái)自群體間的所有兩兩個(gè)體間差異的均值
πWithin:來(lái)自亞群內(nèi)所有兩兩個(gè)體間差異的均值
正選擇 vs 負(fù)選擇
positive selection (正選擇):自然選擇:選留:一些稀少的等位基因扛邑,擁有這些等位基因的個(gè)體能繁殖更多的后代;這樣的突變基因往往具有與原來(lái)基因不同的功能铐然,而且該功能使得擁有它的生物更能適應(yīng)環(huán)境蔬崩。
negative selection(負(fù)選擇):指群體中出現(xiàn)有害突變等位基因時(shí),攜帶該等位基因的個(gè)體會(huì)因?yàn)樯媪蛴越档投鴱娜后w中淘汰搀暑,也叫凈化選擇沥阳。
選擇清除 vs 背景選擇
選擇清除:在有利突變產(chǎn)生后被正選擇固定的過(guò)程中,與之連鎖的中性位點(diǎn)的變異也被固定自点。
背景選擇:負(fù)選擇在清除有害突變時(shí)桐罕,也會(huì)隨之清除與其連鎖的中性位點(diǎn)的變異。
選擇清除和背景選擇都會(huì)導(dǎo)致基因組上受選擇的區(qū)域遺傳多樣性下降桂敛,兩者很難區(qū)分功炮,但背景選擇在群體中不會(huì)導(dǎo)致高頻等位基因突變出現(xiàn)。
連鎖不平衡(Linkage disequilibrium, LD):指群體內(nèi)不同位點(diǎn)等位基因間的非隨機(jī)性組合的關(guān)系术唬,即當(dāng)位于同一條染色體的兩個(gè)等位基因(A,B)同時(shí)存在的概率,大于群體中因隨機(jī)分布而同時(shí)出現(xiàn)的概率時(shí),就稱這兩個(gè)點(diǎn)處于LD狀態(tài)薪伏。通常用D’和r2值表示。一般來(lái)說(shuō),在連鎖不平衡分析中, 野生種的 LD 值較低,而馴化種由于受到了正選擇的作用粗仓,LD 值就會(huì)偏大嫁怀。
瓶頸效應(yīng):由于環(huán)境驟變(如火災(zāi)设捐、地震、洪水等)或人類活動(dòng)(如人工選擇塘淑、馴化)萝招,使得某一生物種群的規(guī)模迅速減少,僅有一少部分個(gè)體能夠順利通過(guò)瓶頸事件朴爬,在之后的恢復(fù)期內(nèi)產(chǎn)生大量后代即寒。
遷移壓力(又叫基因流):由于某種原因,具有某一基因頻率的群體的一部分移入基因頻率與其不同的另一群體召噩,并雜交定居母赵,就會(huì)引起遷入群體的基因頻率發(fā)生改變。