GENE模塊---從基因組中提取啟動(dòng)子类垫，UTR序列，引物設(shè)計(jì)及限定引物所產(chǎn)生的區(qū)域

從基因組中提取啟動(dòng)子序列琅坡，UTR序列往往是費(fèi)時(shí)費(fèi)力的過(guò)程悉患。SPDE的gene模塊是專(zhuān)門(mén)為那些從事純粹實(shí)驗(yàn)工作的老師與學(xué)生設(shè)計(jì)。其具體過(guò)程如下：

點(diǎn)擊SPDE的gene模塊（如紅色箭頭所示）：

SPDE的gene模塊

在第二個(gè)板塊中榆俺，用戶可以提取啟動(dòng)子序列（①）售躁，不含UTR區(qū)基因全長(zhǎng)（②），含有UTR區(qū)的基因全長(zhǎng)（③）以及提取UTR區(qū)（④）：

從基因組序列中提取四種序列

其使用過(guò)程只需要按照軟件表面的提示輸入相應(yīng)內(nèi)容即可茴晋。

第一個(gè)框中提示的是基因ID：請(qǐng)大家注意陪捷，這里的基因ID指的是GFF/GFF3文件mRNA這一行所對(duì)應(yīng)的ID，如下圖所示：

基因ID所在的位置

第二框提示的是啟動(dòng)子長(zhǎng)度晃跺，給大家默認(rèn)提取的是2000 bp長(zhǎng)度，對(duì)啟動(dòng)子克隆而言毫玖，該長(zhǎng)度足夠掀虎。因此，如果你想提取的確實(shí)是2000 bp付枫，那么該位置不需要輸入數(shù)值烹玉，但，如果有其他長(zhǎng)度需求阐滩，那么想提取多長(zhǎng)二打，就輸入多長(zhǎng)即可，例如輸入1500：

想要提取1500 bp啟動(dòng)子時(shí)的參數(shù)設(shè)置

第三框掂榔，提示的是輸入原始的GFF/GFF3文件继效。那么，這個(gè)文件就是原始的GFF文件装获，其基本形式應(yīng)該是或者類(lèi)似這樣子：

標(biāo)準(zhǔn)GFF/GFF3文件

第四框瑞信，提示的是輸入格式化的基因組序列文件⊙ㄔィ基因組序列文件指的是標(biāo)明每條染色體或者scaffold上有哪些序列的文件凡简，例如：

基因組序列文件

而格式化的意思是需要將你的基因組序列文件進(jìn)行處理，生成一個(gè)可利用的索引文件（即fai文件）精肃。該過(guò)程的實(shí)現(xiàn)放在了SPDE的format模塊秤涩，如下：

格式化基因組序列文件

會(huì)生成一個(gè)后綴為fai的文件，在這里司抱，同學(xué)們需要注意筐眷，剛剛上面所說(shuō)的第四個(gè)框中放入的文件是基因組序列文件而不是生成的這個(gè)fai文件，大家可以將fai文件理解成一本書(shū)的目錄而我們想要閱讀的并不是書(shū)的目錄而是書(shū)的內(nèi)容习柠，但目錄的存在可以使我們更方便的找到想要的內(nèi)容浊竟，僅此而已怨喘。所以，正式放入的應(yīng)該是基因組序列文件振定。另外必怜，需要對(duì)放入的ID補(bǔ)充一點(diǎn)：SPDE默認(rèn)的ID是gff文件中關(guān)鍵詞mRNA所對(duì)應(yīng)的后面的ID，如下圖所示：

ID指的是等號(hào)之后后频，分號(hào)之前的部分梳庆。用gff文件時(shí)請(qǐng)大家檢查三個(gè)問(wèn)題：一個(gè)是gff文件第一列所注明的染色體ID是否與你基因組文件格式化后產(chǎn)生的fai文件中的ID是一致的？第二個(gè)是你的gff文件里是否有關(guān)鍵詞mRNA（如果沒(méi)有的話可以批量替換一下）卑惜？第三個(gè)是你所使用的ID是否是正確的膏执？給大家提供了一個(gè)只需要輸入ID就可以從基因組文件中提取序列的方法，方便的同時(shí)也對(duì)文件格式有嚴(yán)格的要求露久。有些感慨更米，魚(yú)與熊掌不可兼得。不過(guò)毫痕，在后續(xù)的版本中會(huì)考慮另外的形式以解決這個(gè)問(wèn)題征峦。

當(dāng)上述四個(gè)框按照提示放入正確的文件或者信息后，只要點(diǎn)擊相應(yīng)的按鈕消请，就可以在右側(cè)的框中看到相應(yīng)的序列栏笆，例如：

提取的內(nèi)容在右側(cè)框中顯示

在提取啟動(dòng)子后，大家可能要設(shè)計(jì)引物進(jìn)行克隆臊泰。在第一個(gè)模塊的第三個(gè)部分蛉加，安排了引物設(shè)計(jì)功能。這部分的核心是primer3程序缸逃≌爰ⅲ基本用法只需要按照界面提示進(jìn)行即可，有以下幾個(gè)點(diǎn)需频，請(qǐng)大家注意：

引物設(shè)計(jì)

第一框中是放入基因序列打厘，那么只需要將你的序列拷貝進(jìn)來(lái)即可。在NCBI或者擬南芥的Tail數(shù)據(jù)庫(kù)贺辰，大家經(jīng)郴Фⅲ可以看到這種類(lèi)型的序列：

NCBI序列格式

前面有數(shù)字，序列與序列間有空格饲化。這種序列大家并不需要額外處理莽鸭，直接拷貝就好。在程序設(shè)計(jì)的過(guò)程中已經(jīng)考慮到這個(gè)問(wèn)題吃靠，SPDE會(huì)自動(dòng)幫大家去除這些額外的東西硫眨。

第二框中是輸入PCR產(chǎn)物的長(zhǎng)度。這里放入的一定是一個(gè)范圍巢块，例如礁阁，150-250巧号。兩個(gè)數(shù)字中間由英文狀態(tài)的短橫線連接。如果只放入150姥闭，這樣的單個(gè)數(shù)字是無(wú)法得到結(jié)果的丹鸿。原因很簡(jiǎn)單，假設(shè)序列長(zhǎng)度就是150 bp而你放入150棚品，那么引物就只能一頭一尾的20 bp左右的序列靠欢，這種情況根本沒(méi)有設(shè)計(jì)的必要。

第三框是可選選項(xiàng)铜跑，不是必須填寫(xiě)的门怪。這個(gè)框的作用是為了限定引物產(chǎn)生的區(qū)域。輸入的數(shù)據(jù)格式是F端引物起始位置+逗號(hào)+長(zhǎng)度+逗號(hào)+R端引物起始位置+逗號(hào)+長(zhǎng)度锅纺。例如掷空，我想要在序列的100到300 bp產(chǎn)生我的F端引物而將R端引物設(shè)計(jì)在序列的450到600 bp這個(gè)區(qū)間內(nèi)，那么這個(gè)時(shí)候囤锉，你的輸入內(nèi)容應(yīng)該是：100,200,450,150坦弟。注意要在英文狀態(tài)下輸入。如果嚼锄，我只想限定F端引物在100到300bp减拭，而R端引物隨意蔽豺，那么這個(gè)時(shí)候該如何設(shè)定呢区丑？例如：100,200,,。請(qǐng)注意修陡，雖然你的R端隨意沧侥，數(shù)字不需要寫(xiě)，但逗號(hào)需要保留魄鸦。如果F端隨意而R端需要限定宴杀，那么方法雷同。另外拾因，需要注意的是旺罢，這個(gè)限定的范圍不應(yīng)該超過(guò)你輸入的PCR產(chǎn)物的長(zhǎng)度。假設(shè)你的PCR產(chǎn)物長(zhǎng)度是100 bp而你輸入的限定條件是100,200,450,150绢记。這個(gè)限定所產(chǎn)生的產(chǎn)物的最短長(zhǎng)度應(yīng)該是150 bp扁达。這與你的PCR產(chǎn)物長(zhǎng)度是沖突的，這個(gè)時(shí)候會(huì)出現(xiàn)錯(cuò)誤蠢熄。

第四框是產(chǎn)生控制文件跪解。這個(gè)控制文件里的內(nèi)容是已經(jīng)經(jīng)過(guò)調(diào)整的、關(guān)于引物設(shè)計(jì)的各類(lèi)參數(shù)签孔，請(qǐng)大家安心叉讥，SPDE中所設(shè)計(jì)的引物窘行，已經(jīng)經(jīng)過(guò)了qPCR驗(yàn)證，一般情況下是沒(méi)有問(wèn)題的图仓。但罐盔，考慮到可能某些同學(xué)對(duì)引物有特殊的設(shè)計(jì)需求，因此決定將這個(gè)控制文件還是提供給大家透绩。在產(chǎn)生控制文件后翘骂，如果還是需要對(duì)參數(shù)進(jìn)行調(diào)整，那么只需要在產(chǎn)生的控制文件的相應(yīng)部分更改帚豪，然后保存即可碳竟。控制文件的產(chǎn)生是點(diǎn)擊按鈕“generate the control file” 完成的狸臣，如下：

產(chǎn)生控制文件的按鈕

建議大家也將文件的名字直接命名成control.txt就好莹桅。當(dāng)然，如果對(duì)引物參數(shù)（例如烛亦，GC含量诈泼，Tm值范圍）沒(méi)有特殊需求，那么在設(shè)計(jì)完引物后煤禽，將該文件直接刪除就好铐达。簡(jiǎn)單點(diǎn)兒說(shuō)就是，控制文件可能不需操作檬果，但一定要有瓮孙。

完成這些之后，點(diǎn)擊下面的設(shè)計(jì)引物按鈕选脊，那么就會(huì)在右側(cè)的框中顯示設(shè)計(jì)的結(jié)果杭抠，如下：

引物設(shè)計(jì)的結(jié)果

當(dāng)然，除了上述功能恳啥，第一模塊還提供了其他一些小的功能偏灿，方便大家日常的一些序列處理，這些序列處理包括：

日常的序列處理

將DNA轉(zhuǎn)為RNA钝的；計(jì)算輸入序列的長(zhǎng)度翁垂；計(jì)算GC含量；將序列反向硝桩；翻譯DNA序列沿猜；將序列反向互補(bǔ)。最后一個(gè)是移除額外信息亿柑。針對(duì)的仍然是像NCBI中的這種帶有大量額外字符的序列（如上數(shù)第十圖）邢疙。結(jié)果是序列前面的數(shù)字和序列中的空格將被全部去除并且將不同行的序列歸到一行中。想要使用哪個(gè)功能，直接點(diǎn)擊該功能前的圓圈即可疟游。

補(bǔ)充：最近經(jīng)常有同學(xué)向我詢問(wèn)全長(zhǎng)引物的設(shè)計(jì)方法呼畸。這里包括兩種不同的方案。如果沒(méi)有所研究物種的基因組序列颁虐，沒(méi)什么好說(shuō)的蛮原，這種情況都不需要設(shè)計(jì)，直接從ATG和終止密碼子起分別向后及向前截取大約20bp另绩，然后注意終止密碼子那段反向互補(bǔ)就可以儒陨，可能有同學(xué)要問(wèn)了，如果這樣設(shè)計(jì)的不行怎么辦笋籽，答案是沒(méi)辦法蹦漠，當(dāng)然也可以硬做，去網(wǎng)上搜一下兼并引物的設(shè)計(jì)方法车海，然后一點(diǎn)兒一點(diǎn)兒擴(kuò)增試試看笛园。在我看來(lái)基因組序列是分子生物學(xué)很重要的一個(gè)基礎(chǔ)，如果沒(méi)有這個(gè)基礎(chǔ)侍芝，還想做分子生物學(xué)這真的會(huì)是項(xiàng)大工程~研铆，所以目前這么多人測(cè)基因組也不是沒(méi)有原因。第二種是有基因組序列州叠。前面提到SPDE可以提取UTR區(qū)棵红。所以整個(gè)思路是利用SPDE提取UTR區(qū)，5‘和3’端都要咧栗，然后將它們分別貼到ATG和終止密碼子兩端逆甜，將序列長(zhǎng)度（當(dāng)然是從ATG到終止密碼子，不包括你貼進(jìn)來(lái)的UTR區(qū)）設(shè)定為引物的產(chǎn)物長(zhǎng)度楼熄，然后用SPDE設(shè)計(jì)忆绰。完成后檢驗(yàn)左右兩段引物是否跨越了整個(gè)序列區(qū)浩峡，如果跨越就用它就好可岂，如果沒(méi)有跨越那么產(chǎn)物長(zhǎng)度不變，然后規(guī)定一下一端引物所必須在的區(qū)域翰灾，設(shè)計(jì)后看另一端差了多少缕粹，那么可以先用這對(duì)引物擴(kuò)增，得到產(chǎn)物后纸淮，將PCR產(chǎn)物作為模板平斩，把差的那些序列直接接到引物上（注意如果是R端引物需要反向互補(bǔ)），再擴(kuò)增咽块。這種方法可能出現(xiàn)的尷尬情況是沒(méi)有找到UTR區(qū)或者只能找到一段（比如只能找到5‘端的）绘面，這種情況也正常，并不是所有基因都有UTR區(qū)~這種情況，要不就先規(guī)定一端引物所在區(qū)域揭璃，該怎么做怎么做晚凿，然后用PCR產(chǎn)物為模板，通過(guò)不斷向引物添加需要的序列來(lái)將這段延長(zhǎng)~總之瘦馍，既然序列都知道了歼秽，想把這段序列克隆出來(lái)應(yīng)該是問(wèn)題不大的，只是有些序列需要費(fèi)點(diǎn)兒事~

最后編輯于：2022.11.08 14:22:51

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末情组，一起剝皮案震驚了整個(gè)濱河市燥筷，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌院崇，老刑警劉巖肆氓，帶你破解...
沈念sama閱讀 206,013評(píng)論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異底瓣，居然都是意外死亡做院，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,205評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)濒持，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)键耕，“玉大人，你說(shuō)我怎么就攤上這事柑营∏郏” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 152,370評(píng)論 0贊 342
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵官套，是天一觀的道長(zhǎng)酒奶。經(jīng)常有香客問(wèn)我，道長(zhǎng)奶赔，這世上最難降的妖魔是什么惋嚎？我笑而不...
開(kāi)封第一講書(shū)人閱讀 55,168評(píng)論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮站刑，結(jié)果婚禮上另伍，老公的妹妹穿的比我還像新娘。我一直安慰自己绞旅，他們只是感情好摆尝，可當(dāng)我...
茶點(diǎn)故事閱讀 64,153評(píng)論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著因悲，像睡著了一般堕汞。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上晃琳，一...
開(kāi)封第一講書(shū)人閱讀 48,954評(píng)論 1贊 283
城市分裂傳說(shuō)
那天讯检，我揣著相機(jī)與錄音琐鲁，去河邊找鬼。笑死人灼，一個(gè)胖子當(dāng)著我的面吹牛绣否，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播挡毅，決...
沈念sama閱讀 38,271評(píng)論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼蒜撮，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了跪呈？” 一聲冷哼從身側(cè)響起段磨，我...
開(kāi)封第一講書(shū)人閱讀 36,916評(píng)論 0贊 259
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎耗绿，沒(méi)想到半個(gè)月后苹支，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 43,382評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡误阻，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,877評(píng)論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年债蜜，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片究反。...
茶點(diǎn)故事閱讀 37,989評(píng)論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡寻定，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出精耐，到底是詐尸還是另有隱情狼速，我是刑警寧澤，帶...
沈念sama閱讀 33,624評(píng)論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布卦停，位于F島的核電站向胡，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏惊完。R本人自食惡果不足惜僵芹，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,209評(píng)論 3贊 307
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望小槐。院中可真熱鬧拇派，春花似錦、人聲如沸本股。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,199評(píng)論 0贊 19
一樁弒父案桐腌，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)拄显。三九已至，卻和暖如春案站，著一層夾襖步出監(jiān)牢的瞬間躬审，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 31,418評(píng)論 1贊 260
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留承边，地道東北人遭殉。一個(gè)月前我還...
沈念sama閱讀 45,401評(píng)論 2贊 352
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像博助，于是被迫代替她去往敵國(guó)和親险污。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,700評(píng)論 2贊 345

GENE模塊---從基因組中提取啟動(dòng)子崭倘，UTR序列翼岁，引物設(shè)計(jì)及限定引物所產(chǎn)生的區(qū)域

GENE模塊---從基因組中提取啟動(dòng)子类垫，UTR序列，引物設(shè)計(jì)及限定引物所產(chǎn)生的區(qū)域

推薦閱讀更多精彩內(nèi)容