使用熒光定量PCR進行真核物種的基因表達量研究時跑杭,經(jīng)常會遇到這樣一個問題:有些基因經(jīng)常存在多個轉(zhuǎn)錄變體,我該使用哪個轉(zhuǎn)錄本的序列進行引物的設計呢梦鉴?
1 什么是轉(zhuǎn)錄變體
要搞清楚這個問題瞻赶,首先要從轉(zhuǎn)錄變體的來源講起维雇。眾所周知,真核生物的基因是由外顯子及其中間的內(nèi)含子組成的睁搭,前體RNA經(jīng)過不同的“可變剪切”途徑赶诊,會形成不同外顯子的組合形式,從而最終導致不同蛋白亞型的形成园骆。如下圖所示:
可以看到舔痪,不同結(jié)合位置的引物,檢測的RNA種類是不同的:引物對1能夠檢測到RNA變體1和2锌唾;引物對2能夠檢測到全部三個轉(zhuǎn)錄變體锄码;引物對3能檢測到RNA變體2和3夺英;引物對4僅能檢測到RNA變體1。
2 選擇哪個序列進行引物設計滋捶?
對于究竟選擇哪一個變體去設計引物更加合適痛悯,不同的人有不同的做法:
① 選擇主要轉(zhuǎn)錄產(chǎn)物,如變體1重窟,即默認該基因的轉(zhuǎn)錄產(chǎn)物絕大多數(shù)為變體1载萌,根據(jù)變體1的序列進行引物設計,即使引物無法檢測某個其他的轉(zhuǎn)錄變體(如引物1)巡扇,也不會影響結(jié)果扭仁。
② 選擇所有轉(zhuǎn)錄產(chǎn)物的共有序列,將所有的轉(zhuǎn)錄產(chǎn)物序列進行多重比對(Multiple Sequence Alignment)霎迫,找到這些變體共同擁有的一整段序列,在該序列上進行引物設計(如引物2)帘靡,不管基因的轉(zhuǎn)錄產(chǎn)物是何種變體知给,都逃脫不了引物的結(jié)合,這樣描姚,檢測到的才是該基因的完整表達情況涩赢。
③ 對每個轉(zhuǎn)錄變體進行功能分析,有一些轉(zhuǎn)錄變體他們的功能是有差別的轩勘,有些研究者只需檢測某一種轉(zhuǎn)錄變體的變化筒扒,這樣,需要找到該轉(zhuǎn)錄變體相對于其他變體特有的一段序列(如上圖綠色序列)绊寻,在這段序列中進行引物設計(如引物4)花墩,這樣其他的轉(zhuǎn)錄變體無法被這對引物擴增。
目前對于轉(zhuǎn)錄變體的選擇澄步,主要是以上幾個策略冰蘑。
3 如何快速查找轉(zhuǎn)錄變體的序列?
關(guān)于基因序列的查找可以點此鏈接《如何查找基因序列》村缸。
如果基因有多個轉(zhuǎn)錄變體祠肥, 可以在基因頁面中找到多個NM號,分別點擊進去梯皿,就可以找到各轉(zhuǎn)錄變體的序列了仇箱。
以上這種方法適用于轉(zhuǎn)錄變體較少的情況,但如果基因的轉(zhuǎn)錄變體比較多东羹,那么一個個點擊NM進去找序列就會變得非常麻煩剂桥。如人的血管內(nèi)皮生長因子A基因(VEGFA)有20個轉(zhuǎn)錄變體,下面以human VEGFA基因為例属提,介紹一種較為簡單的方法:
1. 在NCBI主頁渊额,搜索“VEGFA human”,注意此時數(shù)據(jù)庫需選擇gene,點擊Search旬迹。
2. 搜索結(jié)果中火惊,會彈出如下預測框,里面含有該基因的基本信息奔垦,包括別稱屹耐,ID,基因頁面椿猎,轉(zhuǎn)錄產(chǎn)物頁面惶岭,蛋白頁面等等。
3. 點擊“RefSeq Transcript”犯眠,即進入VEGFA的所有轉(zhuǎn)錄產(chǎn)物列表頁面:
- 點擊右上角“Send to”按灶,選擇導出“Gene Features”,點擊“Create File”筐咧。會生成一個Sequences.txt文件鸯旁,保存下來。
5. 打開該txt文件量蕊,里面即是所有轉(zhuǎn)錄變體的FASTA格式序列了铺罢。
找到了這些序列,下面的工作就是將這些序列進行多重比對残炮,找到這些序列的共有(或特異)序列韭赘。
關(guān)于多重序列比對,有基于網(wǎng)頁工具势就、基于本地軟件等多種方式泉瞻。這些方式都可以直接用到上述的txt文件。
總體來說苞冯,基于網(wǎng)頁工具比較便捷瓦灶,不需要預裝軟件,但結(jié)果判讀比較麻煩抱完;基于軟件的方式在后續(xù)共有序列的選取方面要優(yōu)于網(wǎng)頁工具贼陶。
基于網(wǎng)頁工具的比對教程:Clustal Omega
Clustal Omega是歐洲生物信息研究所(EBI)開發(fā)的多序列比對排列工具,現(xiàn)已經(jīng)完全取代了之前ClustalW的地位巧娱。使用該工具不僅能夠?qū)NA或者蛋白質(zhì)進行多序列比對碉怔,并且可以自動生成多種格式或構(gòu)建進化樹等。
網(wǎng)址如下:https://www.ebi.ac.uk/Tools/msa/clustalo/
序列比對教程
1. 打開該網(wǎng)頁禁添,選擇正確的序列類型撮胧,將之前得到的txt文件中的Fasta序列全部復制、粘貼到序列框中(以5條序列為例)老翘。
2. 參數(shù)設置推薦默認就好芹啥,點擊Submit:
3. 經(jīng)過一段時間等待锻离,出現(xiàn)以下結(jié)果:
該結(jié)果將多個RNA按照同源序列重新進行排列,其中墓怀,共有序列下方以*表示汽纠,而非同源區(qū)域則以--隔開。
4. 定位共有序列的區(qū)域
這樣傀履,在比對結(jié)果中找到連續(xù)的*所對應的位置(一定要連續(xù)的)虱朵,就是這幾個轉(zhuǎn)錄變體的共有序列所在區(qū)域驴一。
但是這種比對形式無法直接得到序列肿孵,可以將多行共有序列一一復制粘貼拼接在一起,也可以在任意一個轉(zhuǎn)錄變體中搜索共有序列的頭和尾一小段按傅,中間的就是共有序列梆暮。
SnapGene是生工生物反復推薦過的核酸服协、蛋白序列分析、處理軟件啦粹,對于多序列的比對功能自然也是不在話下的偿荷。
下面以txt序列文件為基礎,介紹一下詳細的多序列比對流程:
(txt文件怎么來的卖陵?在搜索欄中搜索“保守序列”遭顶,點此搜索)
1 打開SnapGene张峰,直接將txt拖入snapgene起始界面泪蔫。
2 SnapGene將自動識別txt中的每個序列,并將其拆分成為單獨的序列文件喘批,點擊“Import”撩荣,軟件將生成一個文件夾,文件夾中含有txt中的每一個FASTA序列饶深。
3. 用SnapGene打開任意一個序列(推薦打開文件大小最大的)餐曹,選擇Tools菜單欄中的“Align Multiple Sequences”功能(快捷鍵Ctrl+L)
4. 在彈出的窗口中,將剩下幾個序列都選中敌厘,點擊“打開”台猴,SnapGene將對選中的序列進行多重比對:
5. 比對結(jié)果如下圖所示,在下方的Map標簽頁俱两,我們能夠看到這幾個轉(zhuǎn)錄變體同源及非同源區(qū)域所在的位置饱狂,非同源區(qū)域以空白或者三角顯示,同源序列以藍色顯示宪彩。
6. 點擊下方的Sequence標簽頁休讳,我們能夠看到具體的比對結(jié)果信息:
7. 我們可以用鼠標選中綠色的區(qū)域,復制尿孔、粘貼就得到了這幾個轉(zhuǎn)錄變體的同源序列了俊柔。
參考:https://www.sangon.com/class_Conservative%20Sequence.html