引物設(shè)計(jì)——QPCR
一鸠按、序列查找
參考漢恒生物技術(shù)文檔
常用數(shù)據(jù)庫
NCBI-GeneBank
Nucleotide
Gene
NCBI不多做介紹。NC表示人類基因組DNA的RefSeq饶碘,NM表示mRNA的RefSeq目尖,NP表示蛋白質(zhì)的RefSeq,LncRNA信息我們參考RefSeq數(shù)據(jù)庫中的數(shù)據(jù)扎运,RefSeq數(shù)據(jù)庫中的數(shù)據(jù)參考數(shù)據(jù)瑟曲,是經(jīng)過人工審核饮戳,其數(shù)據(jù)信息可信,注釋全面洞拨。RefSeq數(shù)據(jù)庫中LncRNA的命名通常是NR或者XR開頭扯罐,后面加數(shù)字,其外顯子信息位置烦衣,數(shù)量信息非常完整歹河。
Ensembl
例如,相同的LncRNA花吟,Ensembl數(shù)據(jù)庫中信息往往要比NCBI多很多秸歧,特別是轉(zhuǎn)錄本數(shù)量。且數(shù)據(jù)變化非承瞥海快且變化會很大键菱,可能昨天瀏覽這個數(shù)據(jù)庫中某個LncRNA只有2個轉(zhuǎn)錄本,隔天再去看的時(shí)候今布,可能就變成3個甚至更多纱耻。NCBI就不同,盡管更新頻率也非常的快险耀,但是LncRNA的變化通常很小,轉(zhuǎn)錄本數(shù)量基本不變化玖喘,序列變化的可能性也非常的小甩牺。
UCSC
UCSC數(shù)據(jù)庫的數(shù)據(jù)更新相對較慢,但有些LncRNA名稱如uc001ylu就需要前往UCSC數(shù)據(jù)庫查詢其序列信息累奈。UCSC Genome Browser可以根據(jù)基因組的位置贬派、基因ID、轉(zhuǎn)錄本等信息進(jìn)行瀏覽查詢澎媒。
高分文獻(xiàn)查找
首先可以根據(jù)文獻(xiàn)獲得目的基因序列
通過閱讀文獻(xiàn)搞乏,找到你感興趣的基因,根據(jù)文中提到的該基因在NCBI 中 的ID 號戒努,直接打開http://www.ncbi.nlm.nih.gov 请敦, 在All Databases 后的下拉框中選擇Nucleotide,把基因 ID 號輸入Search 前面的文本框中储玫,點(diǎn)“Search”侍筛,就可以找到該基因了。
舉例說明
例如:在2003 年JBC 的文章(Conditional Knock-out of Integrin-linked KinaseDemonstrates an Essential Role in Protein Kinase B/Akt Activation)中出現(xiàn)了“calreticulin(GenBank accession number gi 16151096)”撒穷,那么把“16151096”輸入Search 前面的文本框中匣椰,點(diǎn)“Search”,就可以找到該基因了(當(dāng)然包括基因序列等相關(guān)信息)端礼,見下圖禽笑。
檢索結(jié)果界面如下圖入录,可以看到GenBank 號為AY047586 的CALR 基因的相關(guān)信息了:
里面有很多基因的信息,再往下是基因的的核酸序列(ORIGIN 之后):
基因的翻譯區(qū)(CDS)點(diǎn)擊 CDS 即可得到:
下圖標(biāo)示的褐色區(qū)域序列即為基因的編碼區(qū)序列:
這里需要指出一下佳镜,在顯示基因的頁面右下側(cè)有一個LinkOut to external resource僚稿,里面是與該基因相關(guān)的鏈接,對于該基因的相關(guān)研究是很有用的:
根據(jù)已經(jīng)獲得的基因的相關(guān)信息進(jìn)行查找
如果只是知道基因的名字邀杏,怎么查序列呢贫奠?還是舉例說明,比如研究的基因名稱是人的VEGF 基因望蜡,那么怎么在NCBI 中找到它呢唤崭?首先打開http://www.ncbi.nlm.nih.gov/在All Databases 的下拉框中選擇Gene,然后在中間的文本框中輸入基因名稱“VEGF”脖律,點(diǎn)擊Search...
搜索結(jié)果如下:
結(jié)果有很條谢肾,哪一條是我想要的基因呢?這時(shí)候要根據(jù)自己研究的基因所屬物種來選擇小泉,如研究的是人屬(Homo sapiens)的芦疏,則點(diǎn)擊第四條。
里面是這個基因的詳細(xì)信息微姊,需要指出的是酸茴,在NCBI 中,基因有很多別名(Aliases)兢交,你得到的基因名和NCBI 中記錄的名稱有可能不一致薪捍。比如在這里,VEGFA 是NCBI 中記錄的基因名稱配喳,而它還有很多別名酪穿,比如VPF, VEGF(這就是我們要找的基因名稱 ), MVCD1。
再往下看晴裹,可以看到里面可以看到該基因再染色體上的位置被济,以及基因在轉(zhuǎn)錄時(shí)有幾個剪切體等信息。這個基因有很多轉(zhuǎn)錄本(isoform a 到 isoform r)涧团,可以看到其的mRNA 的鏈接(如NM_001025366.2)和蛋白質(zhì)的鏈接(如NP_001020537.2 )
isoform a 到 isoform r 哪個是自己想找的基因呢只磷?這就需要根據(jù)自己查閱的文獻(xiàn)以及在這些基因序列后面的解釋來確定了。如果不清楚泌绣,一般選擇眾多mRNA 轉(zhuǎn)錄本中最長的轉(zhuǎn)錄本(longest isoform)喳瓣,即下圖中所標(biāo)示的isoform a :
如果要找的基因是第一個序列即isoform a, 就可以點(diǎn)擊NM_001025366.1,得到如下基因的信息界面:
然后點(diǎn)擊左上方基因全稱下面的FASTA即可下載該序列赞别。
二畏陕、引物設(shè)計(jì)原則
上述原則不一定需要全部遵循,一般根據(jù)引物設(shè)計(jì)工具擇優(yōu)選擇仿滔,具體設(shè)計(jì)還需要考慮以下情況:
跨外顯子設(shè)計(jì)跨外顯子設(shè)計(jì)的目的就是避免基因組的污染惠毁,跨外顯子設(shè)計(jì)有兩種辦法:
? (1)正向F引物和反向R引物落在不同的外顯子上:
此處注意:(a)如果產(chǎn)物大小允許犹芹,正向F引物和反向R引物可以落在不同的外顯子上;(b)如果正向F引物和反向R引物只能落在兩個相鄰的外顯子上鞠绰,那優(yōu)先選擇內(nèi)含子最大的兩個外顯子上腰埂。
? (2)正向引物或者反向引物跨了兩個外顯子:
此處注意:(a)如果能選擇(1)就不要選擇(2)方法設(shè)計(jì),(2)設(shè)計(jì)方法引物位置受限蜈膨,設(shè)計(jì)得到的引物參數(shù)可能不是最優(yōu)屿笼。(b)如果選擇(2)方法設(shè)計(jì),那跨兩個外顯子的引物的3端序列不要跨第二個外顯子太多序列翁巍,建議不要超過6個堿基驴一,否則就相當(dāng)于沒有跨外顯子設(shè)計(jì)。
特異性比對
從上述數(shù)據(jù)庫中查到該序列信息后灶壶,建議先使用NCBI進(jìn)行比對肝断,簡單做一個核苷酸比對和基因組比對。核苷酸比對的目的是看看這條序列有沒有與NCBI RefSeq同源性較高的序列信息驰凛。如果有胸懈,可能涉及到需要判斷他們是否是同一條基因的問題∏∠欤基因組比對的目的是簡單判斷其外顯子個數(shù)組成趣钱。
引物位置
引物盡量不要落在LncRNA序列兩端100bp序列以內(nèi),原因是防止兩端序列不準(zhǔn)確胚宦。
同源區(qū)設(shè)計(jì)
設(shè)計(jì)qPCR引物通常都選擇在同源區(qū)設(shè)計(jì)首有,檢測其總RNA情況,具體根據(jù)各自實(shí)驗(yàn)要求而定间唉。
三、設(shè)計(jì)工具
1. NCBI
登陸 http://www.ncbi.nlm.nih.gov/tools/primer-blast/利术,粘貼這段序列呈野,設(shè)置好 RANGE 和 PCR 產(chǎn)物的大小,然后在下面點(diǎn)擊 GET PRIMERS印叁,可以在線設(shè)計(jì)并比對引物被冒。
最后選擇一個比較特異性的引物,條帶大小要盡量單一轮蜕,其他的基因序列盡量不要比對到昨悼。
2.Primer Premier 5軟件
具體教程:https://jingyan.baidu.com/article/72ee561a18d98ae16138df8a.html
如果鏈接失效建議百度,嘿嘿跃洛!
3. 生物公司官網(wǎng)免費(fèi)設(shè)計(jì)
比如上海生工:https://www.sangon.com
四率触、設(shè)計(jì)后比對
以下參考上海生工技術(shù)服務(wù):https://www.sangon.com/class_Primer-Blast.html
主要目的:使用 Primer-Blast 比對引物的特異性
引物的特異性
引物是一段短的單鏈寡核苷酸,在PCR過程的退火階段汇竭,引物與單鏈模板結(jié)合葱蝗,DNA聚合酶沿著引物的3末端向后進(jìn)行DNA的合成穴张。引物與模板的結(jié)合遵循堿基互補(bǔ)配對的原則,因此两曼,當(dāng)退火溫度不合適或引物設(shè)計(jì)不合理時(shí)皂甘,引物會結(jié)合到模板的非目標(biāo)區(qū)域,從而導(dǎo)致其他片段的擴(kuò)增悼凑。
所謂引物特異性偿枕,就是引物結(jié)合模板正確位置的能力,或者避免結(jié)合非目標(biāo)位置的能力户辫。引物的長度渐夸、GC含量、堿基分布寸莫、Tm值等性質(zhì)捺萌,均會影響其特異性。
Primer-Blast比對引物特異性的原理
NCBI收錄了諸多物種的基因組DNA膘茎、編碼序列mRNA以及其他相關(guān)核酸序列的數(shù)據(jù)桃纯。使用Primer-Blast進(jìn)行比對,首先要輸入一對引物序列披坏,并選擇序列所屬數(shù)據(jù)庫态坦。此時(shí)系統(tǒng)將在該數(shù)據(jù)庫中對序列進(jìn)行查找和對比,并將引物可能結(jié)合的位置進(jìn)行記錄棒拂,一旦結(jié)合位置處于兩條鏈并且產(chǎn)物大小符合要求伞梯,系統(tǒng)就會將這種情況列舉到結(jié)果中。需要注意的是帚屉,結(jié)合模板的引物不僅是一條正向一條反向谜诫,也有可能是兩條正向或者兩條反向引物。
Primer-Blast比對引物特異性的步驟
打開NCBI攻旦,進(jìn)入Blast喻旷,網(wǎng)頁如下:
點(diǎn)擊上圖紅框標(biāo)記的Primer-Blast,進(jìn)入如下界面牢屋,在界面引物序列處且预,將正反向引物序列粘貼進(jìn)去,5-3方向烙无。產(chǎn)物大小默認(rèn)為70~1000锋谐,可以根據(jù)實(shí)際情況進(jìn)行調(diào)整。
選擇相應(yīng)的物種和參考數(shù)據(jù)庫截酷。
首先涮拗,要確保Specificity check一欄中已經(jīng)打勾。Search mode一般選擇Automatic即可。
物種:人源的基因選擇Homo sapiens(taxid:9606)多搀;小鼠的選擇Mus musculus (taxid:10090)歧蕉;大鼠的選擇Rattus norvegicus(taxid:10116)。
參考數(shù)據(jù)庫:要看PCR的模板是什么康铭,如果是提取的RNA反轉(zhuǎn)錄后得到cDNA就選擇Refseq mRNA(針對mRNA)或Refseq RNA(針對mRNA和lncRNA)惯退;若模板是基因組,則應(yīng)該選擇Refseq representative genomes从藤。在Exclusion行中催跪,可以對預(yù)測的序列以及環(huán)境/不可培養(yǎng)樣本序列的干擾。
分析
選好數(shù)據(jù)庫和物種后點(diǎn)擊頁面左下角的Get Primers夷野,系統(tǒng)進(jìn)行分析懊蒸,一段時(shí)間后會進(jìn)入如下頁面:(該頁面以一對人EGFR的qPCR引物為例)
結(jié)果分析
上圖顯示了多個結(jié)果,原因是EGFR基因有多個轉(zhuǎn)錄變體悯搔,這對引物能夠?qū)⑾路斤@示出來的變體都檢測到骑丸。
每個結(jié)果分為多個部分:
第一部分為比對出來的基因結(jié)果;對于mRNA數(shù)據(jù)庫妒貌,提供了該mRNA的NM號通危,對于基因組數(shù)據(jù)庫,則會顯示出基因組編號灌曙,點(diǎn)進(jìn)去會出現(xiàn)預(yù)測的產(chǎn)物序列菊碟。
第二部分為預(yù)測出來的產(chǎn)物大小。
第三部分為正反向引物和模板的結(jié)合形式在刺,“點(diǎn)”代表該位置的序列和模板完全互補(bǔ)配對逆害。
非特異性結(jié)果如下:
如上圖,紅框位置并非是“點(diǎn)”蚣驼,而是堿基魄幕,說明該位置跟模板不匹配,這種屬于潛在的非特異性擴(kuò)增結(jié)果颖杏。
總結(jié)
對于常規(guī)PCR纯陨,產(chǎn)物可以通過凝膠電泳對非特異性條帶進(jìn)行分離,引物的非特異性并不是很重要输玷,但是對于SYBR Green染料法熒光定量PCR队丝,引物的特異性則非常重要靡馁。但是欲鹏,并不是說預(yù)測出了非特異結(jié)果,引物的性質(zhì)就一定不好臭墨,需要具體情況具體對待:
首先赔嚎,引物的3端對擴(kuò)增效率的影響是非常大的,如果預(yù)測出的非特異性結(jié)果中,3端存在不匹配堿基尤误,說明即使引物能夠結(jié)合模板侠畔,但3端會翹起,導(dǎo)致無法擴(kuò)增损晤,這一類的非特異結(jié)果可以忽略软棺。
其次,PCR的產(chǎn)物大小是有限制的尤勋,尤其對于qPCR喘落,由于延伸時(shí)間非常有限,大于1000的產(chǎn)物是基本上無法擴(kuò)增出來的最冰,如果非特異性產(chǎn)物遠(yuǎn)大于目的產(chǎn)物大小瘦棋,這種非特異性結(jié)果也是可以忽略的。
最后暖哨,任何引物工具或者軟件赌朋,都是根據(jù)一定的參數(shù)和算法進(jìn)行的預(yù)測,結(jié)果只是起到了參考篇裁、建議的作用沛慢,并不能代表該引物的實(shí)際使用情況。最后引物的好壞需要設(shè)計(jì)合成后茴恰,使用了才能明確颠焦。