背景介紹
一炼吴、什么是BSA?
BSA(Bulked Segregant Analysis)---混合分組分析法
>根據(jù)目標(biāo)性狀表現(xiàn)型,對(duì)表型分離群體中的個(gè)體/株系依據(jù)目標(biāo)性狀樱蛤,分成性狀差異顯著的兩組
>然后將兩組的個(gè)體或株系DNA分別等量混合,形成性狀相對(duì)的DNA混合池剑鞍。
>再然后建庫(kù)昨凡、測(cè)序、分析的方法(根據(jù)親本間純和差異的位點(diǎn)蚁署,計(jì)算子代池的index值便脊,進(jìn)而挑選差異較大的位點(diǎn)
>可以實(shí)現(xiàn)目標(biāo)性狀的基因定位
二、BSA適應(yīng)的群體類(lèi)型
三光戈、BSA分析的目的
通過(guò)對(duì)極端性狀產(chǎn)生機(jī)理的研究與發(fā)展哪痰,完成家系材料單性狀基因的定位,揭示性狀相關(guān)機(jī)制久妆,應(yīng)用實(shí)際生產(chǎn)過(guò)程中晌杰, 達(dá)到育種期望,提高生產(chǎn)效益筷弦。
選擇樣本:極端親本1和2肋演;極端子代混池1和2
主要分析的內(nèi)容:根據(jù)SNP/INDEL頻率差異分析,確定與極端性狀緊密相關(guān)的分子標(biāo)記,并完成定位基因爹殊;目的基因功能注釋蜕乡。
四、生物信息分析流程
1梗夸、GATK 群call--vcf
2层玲、變異位點(diǎn)注釋
3、index計(jì)算
?????? ? 3.1 挑選親本間純合差異的位點(diǎn)
???????? 3.2 SNP-index的計(jì)算(極端親本P1為參考绒瘦,分別計(jì)算兩個(gè)子代在親本間上述標(biāo)記位置上的SNP-index)
?????? ???????? 候選位點(diǎn):挑選極端性狀子代混池1(跟參考親本性狀相同)的SNP-index接近0称簿,且子代2(與參考親本性狀相反)的SNPindex接近1的位點(diǎn)
???????? 3.3 選擇1Mb為窗口,1kb為步長(zhǎng)惰帽,計(jì)算每個(gè)窗口中SNP-index
????????
4憨降、目標(biāo)性狀的定位
對(duì)于候選的多態(tài)性標(biāo)記位點(diǎn)進(jìn)行ANNOVAR的注釋?zhuān)崛∽⑨尳Y(jié)果,優(yōu)先挑選upstream或者引起stop loss或者stop gain或者非同義突變或可變剪接的位點(diǎn)所在的基因作為候選基因该酗;
??????? 4.1. 外顯子上的候選位點(diǎn):
?????? 4.2.nonsynonymous的位點(diǎn)所在基因以及upstream相關(guān)基因:
5授药、目標(biāo)基因的定位
五、流程回顧
六呜魄、常見(jiàn)問(wèn)題
1悔叽、簡(jiǎn)化基因組BSA比全基因組BSA價(jià)格便宜?
答:簡(jiǎn)化基因組技術(shù),捕獲的基因組信息占基因組大小約1%~10%,全基因組技術(shù),對(duì)至少25倍
2、簡(jiǎn)化基因組測(cè)序適合做BSA性狀定位嗎?
答:針對(duì)微效多基因控制的數(shù)量性狀,與目標(biāo)性狀相關(guān)的位點(diǎn)很多,簡(jiǎn)化基因組或許有幸捕獲到少數(shù)位點(diǎn),但絕大部分會(huì)被遺漏,這對(duì)后續(xù)的研究很不利爵嗅。針對(duì)質(zhì)量性狀或由少數(shù)主效基因控制的數(shù)量性狀,簡(jiǎn)化基因組BSA的方法風(fēng)險(xiǎn)更高娇澎。全基因組BSA性狀定位與簡(jiǎn)化基因組BSA性狀定位見(jiàn)表2-1
3、子代混池的樣品個(gè)數(shù)和測(cè)序深度如何設(shè)計(jì)?為什么?
答: 2013年, James等對(duì)混池個(gè)體數(shù)和測(cè)序深度對(duì)候選基因數(shù)的影響進(jìn)行了評(píng)估睹晒。下圖是評(píng)估結(jié)果,結(jié)果顯示,當(dāng)子代個(gè)數(shù)超過(guò)20個(gè),測(cè)序深度達(dá)到25x以后,候選基因個(gè)數(shù)會(huì)趨于平衡,不會(huì)有更明顯的提升效果趟庄。基于以上文章經(jīng)驗(yàn)以及已完成的BSA項(xiàng)目經(jīng)驗(yàn),推薦20個(gè)個(gè)體進(jìn)行混池,每池20×的測(cè)序深度伪很。
4戚啥、DNA樣品如何混池?先混樣再提DNA?還是先提DNA再等量混合?
答:先提DNA再等量混合,可以減少系統(tǒng)誤差,近年發(fā)表的多數(shù)文獻(xiàn)都是先提DNA再等量混合。
5,能否只測(cè)親本?或者只測(cè)子代池?或者只測(cè)1個(gè)子代池?
答:分兩種情況:
1)如果研究的性狀是EMS誘導(dǎo)的突變性狀,可以只測(cè)兩個(gè)子代池(野生型+突變型)或者測(cè)1個(gè)親本(野生型)和1個(gè)子代池(突變型)锉试。
2)如果研究的性狀是數(shù)量性狀,最好測(cè)2個(gè)親本和2個(gè)子代池,用一個(gè)實(shí)際在線項(xiàng)目評(píng)估了樣品個(gè)數(shù)對(duì)分析結(jié)果的影響,其中4個(gè)樣品的結(jié)果最好(也即2個(gè)親本+2個(gè)子代池),其次是測(cè)一個(gè)親本和兩個(gè)子代池,如果只測(cè)兩個(gè)子代池,假陽(yáng)性會(huì)很高,找出來(lái)的SNP很多(下表)猫十。
6,能否保證定位到的候選區(qū)域的大小和候選基因的個(gè)數(shù)?
答:候選區(qū)域的大小和候選基因個(gè)數(shù)的多少,與群體的大小、親本材料差異的大小呆盖、目標(biāo)性狀特點(diǎn)拖云、測(cè)序深度的多少、分析物種的基因組水平等多項(xiàng)因素相關(guān),因此不能給出統(tǒng)一的標(biāo)準(zhǔn),但可以參考已完成的項(xiàng)目經(jīng)驗(yàn)進(jìn)行估計(jì)絮短。
7,沒(méi)有參考基因組的物種能否做BSA性狀定位?
答:沒(méi)有參考基因組的物種可以進(jìn)行SNP頻率差異分析,可以找到侯選這段,但是無(wú)參定位效果較差,并且缺少注釋文件,獲得的結(jié)果少無(wú)參物秤一般情況不推薦做BSA性狀定位,建議嘗試遺傳圖譜等方案江兢。
8,多倍體物種可以進(jìn)行BSA性狀定位嗎?
答:有參考基因組的多倍體物種,例如: “油菜",可以用BSA進(jìn)行性狀定位。
9, BSA性狀定位可以利用InDel進(jìn)行定位分析嗎?
答:使用SNP標(biāo)記進(jìn)行定位的主要原因是SNP在基因組上的分布密度要比InDelSSR,SV,CNV等要高,使用SNP標(biāo)記可以找到比較精確的區(qū)間丁频。找到候選區(qū)間之后,可以對(duì)候選區(qū)間中的InDel和其他變異進(jìn)行檢測(cè)杉允。直接利用InDel信息進(jìn)行定位缺少文獻(xiàn)支持,并且定位效果不如SNP效果好邑贴。
10,人工誘變只能是EMS誘變嘛?其他誘變方式得到的性狀可否采用BSA性狀定位?
答: BSA性狀定位是基于SNP,通過(guò)比較SNP頻率差異進(jìn)行分析的, EMS誘發(fā)的是點(diǎn)突變,所以EMS誘發(fā)的突變適合這種分析方式;其他的誘變方式誘發(fā)的大部分是結(jié)構(gòu)變異,在SNP水平上可能找不到導(dǎo)致目標(biāo)性狀差異的區(qū)域,所以不適合SNP頻率分析的方法叔磷。
11,全基因組(WGS ) BSA性狀定位與轉(zhuǎn)錄組(RNAseq )進(jìn)行性狀定位的比較拢驾。
答: 2013年,Henke等總結(jié)了全基因組BSA相比轉(zhuǎn)錄組( RNAseg進(jìn)行性狀定位的優(yōu)點(diǎn)
1)覆蓋范圍:全基因組BSA可以覆蓋整個(gè)基因組, 98%的編碼區(qū)可以覆蓋到。而RNAseq只對(duì)編碼區(qū)進(jìn)行測(cè)序改基。
2)基因檢測(cè)的偏好性:全基因組BSA對(duì)基因的檢測(cè)較均勻,無(wú)偏好性,不受時(shí)間或者組織的影響繁疤。RNAseq偏向于在特定時(shí)間或者組織中高表達(dá)的基因。
3)區(qū)域偏好性:基因分布不均勻,若一些區(qū)域基因密度低,用RNAseq可能漏掉秕狰。
4)多態(tài)性:基因組的多態(tài)性多數(shù)位于非編碼區(qū),采用RNAseq檢測(cè)到的多態(tài)牲較低,只有少數(shù)與突變位點(diǎn)連鎖的多態(tài)性標(biāo)記能被RNAseq檢測(cè)到稠腊。
因此,采用全基因組BSA更容易檢測(cè)到與目標(biāo)基因連鎖的多態(tài)性標(biāo)記。
后續(xù)更新鸣哀。架忌。。我衬。叹放。
QTL-seq(數(shù)量性狀)
MutMap(點(diǎn)突變性狀)
InDel-seq(InDel突變性狀)
轉(zhuǎn)錄組BSA