BSA(Bulked Segregant Analysis)赎婚,集群分離分析或分離群體分組分析法页屠。
兩個(gè)特點(diǎn):
1. 混池
2. 性狀分離
所以贷揽,BSA可以稱之為分析有性狀分離的群體分析方法美澳。
BSA能做啥竞阐?
性狀控制基因的初步定位
BSA的基本原理
- 通過具有相對性狀的一對親本雜交僚害,在其任一分離后代群體中硫椰,根據(jù)個(gè)體表型(或基因型)的極端差異,選取一定量個(gè)體贡珊,將其DNA等量混合最爬,構(gòu)建兩個(gè)基因池(pool)。
- 由于兩個(gè)混池只對性狀做了選擇门岔,這兩個(gè)池表型上是一對相對性狀爱致,遺傳上也只存在目標(biāo)基因(或與其緊密連鎖的區(qū)域)的差異。
- 兩池間的DNA差異片段即可看做是與目標(biāo)性狀連鎖的分子標(biāo)記寒随。
- 由于是連鎖糠悯,只能定位到目的基因周圍一定范圍的區(qū)域帮坚,所以是初步定位。
BSA的發(fā)展
- QTL-seq(數(shù)量性狀)
- MutMap(點(diǎn)突變性狀)
- InDel-seq(InDel突變性狀)
- 轉(zhuǎn)錄組BSA
適用性狀
- 質(zhì)量性狀:有無的性狀
- 數(shù)量性狀:有主效QTL(BSA可分析)互艾;無主效QTL(BSA不可分析)
BSA群體構(gòu)建
- 常用群體:F2试和,RILs
- 群體分類:
-暫時(shí)性分離群體:自交或近交后其遺傳組成會(huì)發(fā)生變化,無法永久使用纫普,如F1, F2, BC1群體等阅悍。
-永久性分離群體:株系內(nèi)個(gè)體間的基因型是相同且純合,自交或近交后遺傳組成不會(huì)改變昨稼,可永久使用节视,如RIL、DH等假栓。
BSA基本步驟
- 選擇合適親本構(gòu)建遺傳群體寻行;
- 調(diào)查表型,選取極端表型的個(gè)體構(gòu)建DNA混池匾荆;
- 對極端混池及親本進(jìn)行高通量測序拌蜘,關(guān)聯(lián)分析;
- 結(jié)合物種的參考基因組序列牙丽,對定位區(qū)間基因做功能注釋简卧。
混池測序需要注意的問題
- 保證群體適用
- 最好為F2/Ril/Nil群體
- 如為BC1或F1群體,親本的目標(biāo)位點(diǎn)必有一個(gè)為雜合位點(diǎn)剩岳,混池間差異較小贞滨,效果一般。
- 保證表型鑒定正確
- 極端表型選擇(5-10%)
- 要保證混池間除目標(biāo)性狀外拍棕,無其他性狀差異
- 保證每個(gè)混池的樣本數(shù)晓铆,保證樣本選取時(shí)的隨機(jī)性和代表性
- 要保證足夠的樣本數(shù)
- 一般建議要求每個(gè)混池的樣本數(shù)達(dá)到30或50,這樣才能保證測序推算得到的基因頻率具有代表性绰播。如果某些實(shí)驗(yàn)無法湊夠足夠的樣本數(shù)骄噪,或表型鑒定存在錯(cuò)誤,那么這個(gè)方法的效果將大打折扣蠢箩。
定位精度的影響因素
- 標(biāo)記密度對定位精度的影響逐漸弱化
- 傳統(tǒng)標(biāo)記時(shí)代链蕊,標(biāo)記數(shù)不足,是限制精度主要因素
- 高通量標(biāo)記時(shí)代谬泌,標(biāo)記數(shù)已經(jīng)飽和
- 染色體片段的重組程度滔韵,成為基因定位精度的決定性因素。
- 不同物種重組率差異掌实,定位精度不同陪蜻。
- 不同區(qū)域的片段重組率有差異,同一個(gè)物種不同位置的QTL定位精度也不同贱鼻。
BSA信息分析的原理
- 精髓:兩個(gè)混池間宴卖,等位基因頻率的差異
如何判定SNP是否關(guān)聯(lián)滋将?
- 歐式距離(ED)法
- 四種堿基作為維度
- 測序差異造成深度的偏倚
- 使用頻率代替深度
-
越接近目標(biāo)位點(diǎn)的ED值,越接近于1
-
SNP-index法
SNP index的計(jì)算是對子代池中SNP的一種統(tǒng)計(jì)方法随闽,其原理是利用測序reads對每個(gè)堿基位點(diǎn)的堿基進(jìn)行統(tǒng)計(jì),以某一親本或參考基因組為參考肝谭,統(tǒng)計(jì)子代池中和親本或者參考基因組在某一個(gè)堿基位點(diǎn)相同或者不相同的reads條數(shù)掘宪,計(jì)算不相同reads條數(shù)占總條數(shù)的比例,即為該堿基位點(diǎn)的SNP index分苇。對于有兩個(gè)子代池?cái)?shù)據(jù)的項(xiàng)目添诉,我們會(huì)過濾掉兩個(gè)池中SNP-index均小于0.3的點(diǎn)。對于過濾后的SNP index我們會(huì)利用滑窗口的方式統(tǒng)計(jì)某窗口中所有SNP的SNP-index的平均值作為該窗口的SNP-index医寿,一般默認(rèn)參數(shù)是1Mb的窗口,10kb滑動(dòng)蘑斧。按照上述方法分別計(jì)算兩個(gè)子代池的SNP-index靖秩,然后在計(jì)算兩個(gè)子代池的SNP-index的差值即為delta SNP-index。