轉(zhuǎn)座因子 Transposon
一段DNA順序可以從原位上單獨(dú)復(fù)制或斷裂下來寥假,環(huán)化后插入另一位點(diǎn),并對(duì)其后的基因起調(diào)控作用霞扬,此過程稱轉(zhuǎn)座糕韧。這段序列稱跳躍基因或轉(zhuǎn)座子。轉(zhuǎn)座子是存在于染色體DNA上可自主復(fù)制和位移的基本單位喻圃。
- I型轉(zhuǎn)座子( 復(fù)制-粘貼 )
I型轉(zhuǎn)座子轉(zhuǎn)座中間體是RNA兔沃。I型轉(zhuǎn)座子又被稱為逆元件(Retro element)。該型轉(zhuǎn)座子會(huì)先被轉(zhuǎn)錄為RNA级及,然后該RNA被逆轉(zhuǎn)錄,再次成為DNA额衙,才被插入到目標(biāo)位點(diǎn)中 - II型轉(zhuǎn)座子( 剪切-粘貼 )
II型轉(zhuǎn)座中間體是DNA饮焦,轉(zhuǎn)座子序列的兩端是兩段直接重復(fù)序列(direct repeat,簡(jiǎn)稱dR)窍侧,與它們接壤的是反向重復(fù)序列(invert repeat县踢,簡(jiǎn)為iR),即“回文”序列伟件。然后才是中間的插入序列(Insert sequence硼啤,簡(jiǎn)為IS)。
轉(zhuǎn)座酶
執(zhí)行轉(zhuǎn)座功能的酶斧账,通常由轉(zhuǎn)座子編碼谴返,識(shí)別轉(zhuǎn)座子兩端的特異序列煞肾,能把轉(zhuǎn)座子從相鄰序列中脫離出來,再插入到新的DNA靶位點(diǎn)嗓袱,無同源性要求籍救。
Tn5轉(zhuǎn)座子結(jié)構(gòu)
轉(zhuǎn)座子包括兩端的反向重復(fù)序列和中間的轉(zhuǎn)座基因。反向重復(fù)序列是轉(zhuǎn)座酶結(jié)合的位置渠抹,中間的轉(zhuǎn)座基因就是基因間來回跳躍的基因片段蝙昙。
Tn5 全長(zhǎng)約5.8kb,由編碼三個(gè)抗生素(新霉素梧却、博萊霉素奇颠、鏈霉素)的核心序列和兩條倒置的IS50 序列組成,其中IS50R和IS50L的序列高度同源放航,只有IS50L的一個(gè)堿基存在突變烈拒。IS50具有19bp的倒置末端(外末端outsideend,OE和內(nèi)末端inside end三椿,IE)缺菌,兩倒置末端有7個(gè)bp不同,此倒置末端是轉(zhuǎn)座酶(Tnp)的作用位點(diǎn)搜锰。IS50L和IS50R均含有編碼轉(zhuǎn)座酶(TnP)以及轉(zhuǎn)座阻遏蛋白(lnh)的基因伴郁,但由于IS50L中的堿基突變,造成翻譯提前終止蛋叼,所以僅有IS50R可以產(chǎn)生正常的有活性的TnP和lnh焊傅。
Tn5作用機(jī)制
轉(zhuǎn)座發(fā)生時(shí),兩個(gè)轉(zhuǎn)座酶分子結(jié)合到Tn5轉(zhuǎn)座子的OE末端狈涮,形成兩個(gè)Tnp-OE復(fù)合體狐胎,隨后兩個(gè)復(fù)合體聯(lián)會(huì),末端相互作用而二聚體化歌馍,形成由一個(gè)二聚體蛋白質(zhì)和兩分子DNA組成的聯(lián)會(huì)復(fù)合體握巢。形成該聯(lián)會(huì)復(fù)合體后,Tnp才具有切割DNA的活性松却。形成這種結(jié)構(gòu)有利于協(xié)同Tn5 DNA 鏈的切割和轉(zhuǎn)移暴浦,有利于防止Tnp只對(duì)轉(zhuǎn)座子DNA鏈的一端進(jìn)行切割。結(jié)合在左末端的Tnp負(fù)責(zé)催化右末端的磷酸二酯鍵水解晓锻,而結(jié)合在右末端的Tnp負(fù)責(zé)催化左末端的磷酸二酯鍵水解歌焦。活化Tn p水分子砚哆,此活化的水分子水解DNA鏈独撇,在Tn5的兩末端分別形成兩個(gè)3’-OH親核基團(tuán),該親核基團(tuán)進(jìn)而攻擊互補(bǔ)鏈形成發(fā)夾結(jié)構(gòu)。隨后另一活化的水分子水解該發(fā)夾結(jié)構(gòu), 形成平末端的Tn5纷铣,整個(gè)聯(lián)會(huì)復(fù)合體離開供體鏈卵史,并結(jié)合到靶DNA上。Tn5的3’-OH親核攻擊靶序列关炼,在轉(zhuǎn)座子插入位點(diǎn)之間形成9bp的粘性末端程腹,轉(zhuǎn)座子的3’-OH同靶DNA的5’-P之間形成共價(jià)鍵,轉(zhuǎn)座子就插入到靶序列之中儒拂。在DNA 聚合酶的作用下補(bǔ)平缺口寸潦,轉(zhuǎn)座子的兩端形成9 bp的正向重復(fù)序列。整個(gè)轉(zhuǎn)座過程完成了基因從原始DNA被剪切之后粘貼在另一受體DNA 的過程社痛,實(shí)現(xiàn)了基因的“跳躍”(如圖)见转。
Tn5應(yīng)用
- Illumina Nextera DNA Library Preparation Kit
研究人員發(fā)現(xiàn)整個(gè)轉(zhuǎn)座子序列并不是轉(zhuǎn)座必須的,只需轉(zhuǎn)座子的末端核心序列蒜哀,轉(zhuǎn)座酶便能將該部分序列插入并連接至基因組內(nèi)斩箫;根據(jù)這個(gè)原理,將測(cè)序接頭序列加入末端核心序列中撵儿,可簡(jiǎn)捷地引入測(cè)序接頭乘客,完成文庫構(gòu)建。
由下圖可看到在tn5二聚體里面的雙鏈Oligo是Nextera Tn5 binding site淀歇,19個(gè)堿基易核,全部都是一樣的。伸出來的部分是單鏈的序列浪默,
藍(lán)色:Nextera tn5 read1 (5'-TCGTCGGCAGCGTC-3')
紅色:Nextera tn5 read2(5’-GTCTCGTGGGCTCGG-3')
Tn5二聚體結(jié)構(gòu)
將P5牡直、P7 端部分接頭序列( Adapter 1/2 )和轉(zhuǎn)座子末端序列形成包被接頭,與Tnp 形成Tn5 轉(zhuǎn)座復(fù)合體纳决。該復(fù)合體打斷受體DNA碰逸,會(huì)形成一端帶有P5部分接頭Adapter 1,一端帶有P7 部分接頭Adapter 2的DNA阔加,之后通過PCR加上Barcode以及接頭其余部分饵史,形成含P5端與P7端完整接頭的DNA 文庫。
Illumina Nextera 建庫流程
Tn5 用于測(cè)序文庫構(gòu)建時(shí)胜榔,將DNA 片段化胳喷、末修加A、接頭連接等多步反應(yīng)轉(zhuǎn)變?yōu)?步反應(yīng)苗分,極大縮短建庫時(shí)間,提高工作效率牵辣。但是這一步之后摔癣,接頭與插入片段之間有9bp 的gab 需要補(bǔ)平(如圖5),這就是為什么Tn5 建庫在PCR之前必須72 ℃反應(yīng)5min ,而且所用的PCR 酶需要是具有鏈置換功能的非熱啟動(dòng)酶择浊。
image.png
Vazyme TruePrep? DNA Library Prep Kit
建庫原理
TruePrep Tagment Enzyme Mix (TTE Mix)中包含轉(zhuǎn)座酶和兩種等摩爾的接頭Adapter 1和Adapter 2戴卜。將該預(yù)混液與DNA混合,55°C下孵育10 min琢岩,即可實(shí)現(xiàn)DNA片段化的同時(shí)末端接上接頭投剥。這種片段化產(chǎn)物經(jīng)N5 (N5XX)和N7 (N7XX)以及P5和P7 (PCR Primer Mix, PPM)兩對(duì)引物擴(kuò)增、擴(kuò)增產(chǎn)物大小分選和純化后即為可測(cè)序文庫担孔。-
文庫結(jié)構(gòu)
Vazyme Trueprep文庫分子結(jié)構(gòu) -
建庫流程
Vazyme Trueprep建庫流程
ATAC-seq
ATAC-seq也即Assay for Transposase-Accessible Chromatin with high throughput sequencing江锨,是利用轉(zhuǎn)座酶探究可接近性染色質(zhì)高通量測(cè)序技術(shù)。
- 染色質(zhì)開放性
染色質(zhì)分為常染色質(zhì)和異染色質(zhì)糕篇,在結(jié)構(gòu)上常染色質(zhì)折疊壓縮程度低啄育,處于伸展?fàn)顟B(tài),DNA復(fù)制拌消,基因轉(zhuǎn)錄都發(fā)生在DNA的致密高級(jí)結(jié)構(gòu)變?yōu)樗缮⒌臓顟B(tài)挑豌;這部分打開的染色質(zhì),就叫開放染色質(zhì)(open chromatin)墩崩。而打開的染色質(zhì)氓英,就有足夠的區(qū)域允許一些調(diào)控蛋白(比如轉(zhuǎn)錄因子和輔因子)過來與之相結(jié)合。而染色質(zhì)的這種特性鹦筹,就叫做染色質(zhì)的可接近性(chromatin accessibility)铝阐。通過研究細(xì)胞特定狀態(tài)下開放的染色質(zhì)區(qū)域可以在DNA水平上了解其轉(zhuǎn)錄調(diào)控。 - 染色質(zhì)區(qū)域開放性研究方法
傳統(tǒng)使用的的實(shí)驗(yàn)方法主要是有MNase-seq和DNase-seq盛龄,這兩種實(shí)驗(yàn)方法的主要思路是:染色質(zhì)變得開放饰迹,就意味著DNA和組蛋白的聚集程度降低,就會(huì)有一部分DNA暴露出來余舶。而一旦失去了蛋白質(zhì)的保護(hù)啊鸭,這部分DNA就可以被DNA酶(MNase或DNase I)所切割。然后匿值,我們?cè)侔亚懈钔甑腄NA拿來測(cè)序赠制,和已知的全基因組序列相比較,就能發(fā)現(xiàn)被切割的是哪些序列挟憔,沒有被切掉的基因序列又在哪里钟些,就知道開放的染色質(zhì)區(qū)域在哪里了。不過绊谭,這兩個(gè)方法有明顯的缺陷政恍,即耗時(shí)費(fèi)力與重復(fù)性差。雖然FAIRE-seq 不依賴酶和抗體达传,但其檢測(cè)背景較高篙耗,測(cè)序信噪比低迫筑,甲醛交聯(lián)時(shí)間不好把握等缺陷,限制其使用范圍宗弯。 -
染色體的結(jié)構(gòu)脯燃。
染色體主要由DNA和蛋白質(zhì)組成,每一條染色單體由單個(gè)線性DNA分子組成蒙保,細(xì)胞核中的DNA是經(jīng)過高度有序的包裝辕棚,包裝分為多個(gè)水平,核小體核心顆粒(nucleosome core particle)邓厕、染色小體(chromatosome)逝嚎、 30 nm水平染色質(zhì)纖絲(30 nm fibre)和高于30 nm水平的染色體包裝
染色體逐級(jí)結(jié)構(gòu) -
研究開放染色質(zhì)的方法對(duì)比
ATAC-seq利用Tn5轉(zhuǎn)座酶人為將將攜帶已知DNA序列標(biāo)簽的轉(zhuǎn)座復(fù)合物,加入到細(xì)胞核中邑狸,再利用已知序列的標(biāo)簽進(jìn)行PCR建庫測(cè)序懈糯,就知道哪些區(qū)域是開放染色質(zhì)了。ATAC-seq出來的結(jié)果单雾,和傳統(tǒng)方法出來的結(jié)果具有很強(qiáng)的一致性赚哗,同時(shí)也和ChIP-seq有較高的吻合程度。而相比較而言硅堆,ATAC-seq的重復(fù)性屿储,比MNase-seq和DNase-seq的更強(qiáng),操作起來也更加簡(jiǎn)便渐逃,而且只需要很少的細(xì)胞/組織量够掠,同時(shí)測(cè)序信號(hào)更加好。目前已經(jīng)成為研究染色質(zhì)開放性首選的技術(shù)方法
不同實(shí)驗(yàn)方法獲得開放性染色質(zhì)分析的示意圖
ATAC-seq優(yōu)勢(shì):
- 靈敏性高:低細(xì)胞起始量(500-50000個(gè))茄菊;
- 操作簡(jiǎn)單疯潭,耗時(shí)短;
- 實(shí)驗(yàn)重復(fù)性好
- 能同時(shí)揭示開放染色質(zhì)的基因組位置面殖,DNA結(jié)合蛋白竖哩,轉(zhuǎn)錄結(jié)合位點(diǎn)的相互作用
ATAC-seq缺點(diǎn):
- Tn5通過插入剪斷DNA并將測(cè)序接頭連接到剪斷的兩個(gè)DNA片段的末端,因此對(duì)于一個(gè)DNA片段而言脊僚,其兩端的接頭連接是隨機(jī)的相叁,這便導(dǎo)致同一片段兩端的接頭有50%的概率是同一接頭。而只有連接不同接頭的片段才可用于富集擴(kuò)增及測(cè)序辽幌,因此增淹,有一半的片段無法利用;
- 大量剪斷的DNA由于片段過大乌企,無法進(jìn)行PCR富集;
- Tn5 的活性受反應(yīng)溶液的組成及反應(yīng)條件影響虑润,仍然需要優(yōu)化以便提高剪切效果;
- ATAC-seq在植物細(xì)胞中存在以下難點(diǎn):細(xì)胞壁的存在加酵,葉綠體拳喻、線粒體等細(xì)胞器的污染梁剔,缺少穩(wěn)定遺傳的細(xì)胞系;