1 外顯子和外顯子組
外顯子是蛋白質(zhì)的編碼區(qū)域白粉,是這和生物基因組的一部分传泊。基因組中的全部外顯子稱(chēng)為外顯子組鸭巴。人類(lèi)基因組大約有1.8*10^5個(gè)外顯子眷细,30Mb,占人類(lèi)基因組的1%鹃祖。
研究表明溪椎,人類(lèi)85%以上的疾病基因都由外顯子堿基突變?cè)斐伞?/p>
2外顯子測(cè)序技術(shù)的原理
Exome sequencing, 也叫 whole exome sequencing (WES)
包括三步:
- 外顯子序列的捕獲富集
- DNA測(cè)序
- 數(shù)據(jù)統(tǒng)計(jì)分析
2.1 外顯子組的捕獲富集
目前,主要通過(guò)(NimbleGen)和安捷倫(Agilent) 兩種捕獲芯片對(duì)外顯子序列進(jìn)行富集恬口。其基本原理是捕獲校读,富集,高通量分析
- 首先將基因組 DNA隨機(jī)打斷成200 ~ 300 bP 左右的片段,隨后進(jìn)行 DNA片段平末端修復(fù)祖能,5'端加磷酸基團(tuán)歉秫,3'端 加 PolyA 尾 ,通過(guò) TA連接將接頭序列加到片段兩端养铸,經(jīng)過(guò)一輪 PCR增后成為完整的片段文庫(kù)
- 然后將這些DNA片段與捕獲芯片進(jìn)行雜交雁芙,從而得到富集的目標(biāo)片段;隨機(jī)把目的片段連接成長(zhǎng)鏈DNA片段
- 然后再次隨機(jī)打 斷并在其兩端連接上測(cè)序接頭
- 然后用與接頭相匹配的序列為引物進(jìn)行PCR擴(kuò)增
- 經(jīng)質(zhì)量檢測(cè)合格后的外顯子組文庫(kù)即可上機(jī)測(cè)序轧膘。
2.2 DNA測(cè)序
二代測(cè)序?yàn)橹?/p>
2.3 數(shù)據(jù)分析
- 常規(guī)圖像信息數(shù)據(jù)分析
去噪音,銳化兔甘,定位谎碍,校正等
- 生物信息學(xué)分析
挖掘變異位點(diǎn)(包括SNP,短的插入/缺失片段)
流程是:通過(guò)質(zhì)控去除測(cè)序中的低質(zhì)量reads,然后將高質(zhì)量的reads與參考基因組進(jìn)行比對(duì)洞焙,統(tǒng)計(jì)SNP蟆淀,Indels,CNV等闽晦,并進(jìn)行注釋?zhuān)Y選扳碍,分析,驗(yàn)證等仙蛉。
3 應(yīng)用
3.1 遺傳性疾病的檢測(cè)
遺傳性疾病包括單基因并笋敞,多基因病,染色體異常疾病荠瘪,線粒體基因病和體細(xì)胞遺傳病等夯巷。
單基因疾病又叫孟德?tīng)栠z傳病,是單個(gè)基因突變導(dǎo)致的疾病哀墓,常以孟德?tīng)栠z傳模式存在于家系趁餐。
3.2 發(fā)現(xiàn)致癌基因和抑癌基因
外顯子區(qū)域突變?nèi)菀讓?dǎo)致非正常功能蛋白的產(chǎn)生,甚至和細(xì)胞癌變能力相關(guān)篮绰。這對(duì)標(biāo)記物后雷,治療等有重要意義。