PlantCARE預測植物啟動子-順式作用元件

啟動子

啟動子是RNA 聚合酶識別、結(jié)合和開始轉(zhuǎn)錄的一段DNA 序列遍坟,它含有RNA 聚合酶特異性結(jié)合和轉(zhuǎn)錄起始所需的保守序列,多數(shù)位于結(jié)構基因轉(zhuǎn)錄起始點的上游,啟動子本身不被轉(zhuǎn)錄爽醋。但有一些啟動子(如tRNA啟動子)位于轉(zhuǎn)錄起始點的下游,這些DNA序列可以被轉(zhuǎn)錄涮瞻。啟動子的特性最初是通過能增加或降低基因轉(zhuǎn)錄速率的突變而鑒定的。啟動子一般位于轉(zhuǎn)錄起始位點的上游幾百至幾千bp不等,怎么用plantcare預測轉(zhuǎn)錄起始位點?

示例歼疮,以下文章將轉(zhuǎn)錄起始位置前2000bp進行了預測杂抽,并分成三類,有興趣可以參考原文:

Genome?wide characterization and analysis of the CCT motif family
genes in soybean (Glycine max)

PlantCARE分析

提取轉(zhuǎn)錄起始位置

也就是起始密碼子ATG前2000bp位置韩脏,根據(jù)gff3文件提取的時候需要注意正負鏈怠蹂,或者使用TBTOOLS進行提取翼悴,有位置后镇饺,根據(jù)以下腳本提纫彀:

samtools faidx ref.fa Chr01:353407-373407 >GM0600.fa

提取到序列后,上PlantCARE網(wǎng)站進行預測PlantCARE官網(wǎng)

search for CARE.png

等網(wǎng)站跑完后济竹,會將結(jié)果發(fā)至填寫的郵箱,解壓后會得到plantCARE_output_PlantCARE_*.tab文件霎槐,小編根據(jù)文章分的三類送浊,寫了幾個小腳本,有興趣可以參考

(1)Plant growth and development

grep.sh

grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'A-box'  >A-box
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'AE-box'  >AE-box
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'Box 4' >Box-4
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'CAT' >CAT-box
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'circadian' >Circadian
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'GA' >GA-motif
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'GATA' >GATA-motif
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'G' >G-box
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i  'GCN4' >GCN4-motif
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i  'GT1' >GT1-motif
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i  'I-box' >I-box
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i  'RY' >RY-element
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i  'MRE' >MRE

sort.sh

cut -f 1 A-box |sort|uniq -c | awk '{print$2"\t"$1}' > A-box.xls
cut -f 1 AE-box |sort|uniq -c | awk '{print$2"\t"$1}' >AE-box.xls
cut -f 1 Box-4 |sort|uniq -c | awk '{print$2"\t"$1}' >Box-4.xls
cut -f 1 CAT-box |sort|uniq -c | awk '{print$2"\t"$1}' >CAT-box.xls
cut -f 1 Circadian |sort|uniq -c | awk '{print$2"\t"$1}' >Circadian.xls
cut -f 1 GA-motif |sort|uniq -c | awk '{print$2"\t"$1}' >GA-motif.xls
cut -f 1 GATA-motif |sort|uniq -c | awk '{print$2"\t"$1}' >GATA-motif.xls
cut -f 1 G-box |sort|uniq -c | awk '{print$2"\t"$1}' >G-box.xls 
cut -f 1 GCN4-motif |sort|uniq -c | awk '{print$2"\t"$1}' >GCN4-motif.xls
cut -f 1 GT1-motif |sort|uniq -c | awk '{print$2"\t"$1}' >GT1-motif.xls 
cut -f 1 I-box |sort|uniq -c | awk '{print$2"\t"$1}' >I-box.xls
cut -f 1 MRE |sort|uniq -c | awk '{print$2"\t"$1}' >MRE.xls
cut -f 1 RY-element |sort|uniq -c | awk '{print$2"\t"$1}' >RY-element.xls

(2)Abiotic and biotic stresses

grep.sh

grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'ARE' >ARE 
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep   'DRE core' >DRE-core
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'LTR' >LTR
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'MBS' >MBS
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'MYB' |grep -v site>MYB
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'MYC' >MYC
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'STRE' >STRE
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'TC' >TC-rich-repeat
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'W' >W-box
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'WUN' >WUN-motif

sort.sh

cut -f 1 ARE |sort|uniq -c | awk '{print$2"\t"$1}' >ARE.xls
cut -f 1 DRE-core |sort|uniq -c | awk '{print$2"\t"$1}' >DRE-core.xls
cut -f 1 LTR |sort|uniq -c | awk '{print$2"\t"$1}' >LTR.xls
cut -f 1 MBS |sort|uniq -c | awk '{print$2"\t"$1}' >MBS.xls
cut -f 1 MYB |sort|uniq -c | awk '{print$2"\t"$1}' >MYB.xls
cut -f 1 MYC |sort|uniq -c | awk '{print$2"\t"$1}' >MYC.xls
cut -f 1 STRE |sort|uniq -c | awk '{print$2"\t"$1}' >STRE.xls
cut -f 1 TC-rich-repeat |sort|uniq -c | awk '{print$2"\t"$1}' >TC-rich-repeat.xls
cut -f 1 W-box |sort|uniq -c | awk '{print$2"\t"$1}' >W-box.xls
cut -f 1 WUN-motif |sort|uniq -c | awk {'print$2"\t"$1}' >WUN-motif.xls

(3)Phytohormone responsive

grep.sh

grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'ABRE' >ABRE
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'as-1' >as-1
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'CGTCA' >CGTCA-motif
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'CARE' >CARE
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'ERE'  >ERE
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'P' >P-box
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'TATC' >TATC-box
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'TCA-element' >TCA-element
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'TGACG' >TGACG-motif
grep -v Unnamed plantCARE_output_PlantCARE_*.tab|grep -v short_function|cut -f 1,2|grep -i -w 'TGA-element' >TGA-element-motif 

sort.sh

cut -f 1 ABRE |sort |uniq -c |awk '{print$2"\t"$1}'>ABRE.xls
cut -f 1 as-1 |sort |uniq -c |awk '{print$2"\t"$1}'>as-1.xls
cut -f 1 CARE |sort |uniq -c |awk '{print$2"\t"$1}'>CARE.xls
cut -f 1 CGTCA-motif |sort |uniq -c |awk '{print$2"\t"$1}'>CGTCA-motif.xls
cut -f 1 ERE |sort |uniq -c |awk '{print$2"\t"$1}'>ERE.xls
cut -f 1 P-box |sort |uniq -c |awk '{print$2"\t"$1}'>P-box.xls
cut -f 1 TATC-box |sort |uniq -c |awk '{print$2"\t"$1}'>TATC-box.xls
cut -f 1 TCA-element |sort |uniq -c |awk '{print$2"\t"$1}'>TCA-element.xls
cut -f 1 TGACG-motif |sort |uniq -c |awk '{print$2"\t"$1}'>TGACG-motif.xls
cut -f 1 TGA-element-motif |sort |uniq -c |awk '{print$2"\t"$1}'>TGA-element-motif.xls

有網(wǎng)站結(jié)果后丘跌,也可以使用TBTOOLS進行可視化植物啟動子-順式作用元件-批量提取-預測-可視化分析

TBTOOLS.png
最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末袭景,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子闭树,更是在濱河造成了極大的恐慌耸棒,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件报辱,死亡現(xiàn)場離奇詭異与殃,居然都是意外死亡,警方通過查閱死者的電腦和手機碍现,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門幅疼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人昼接,你說我怎么就攤上這事爽篷。” “怎么了慢睡?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵逐工,是天一觀的道長。 經(jīng)常有香客問我漂辐,道長泪喊,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任者吁,我火速辦了婚禮窘俺,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己瘤泪,他們只是感情好灶泵,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著对途,像睡著了一般赦邻。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上实檀,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天惶洲,我揣著相機與錄音,去河邊找鬼膳犹。 笑死恬吕,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的须床。 我是一名探鬼主播铐料,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼豺旬!你這毒婦竟也來了钠惩?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤族阅,失蹤者是張志新(化名)和其女友劉穎篓跛,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體坦刀,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡愧沟,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了求泰。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片央渣。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖渴频,靈堂內(nèi)的尸體忽然破棺而出芽丹,到底是詐尸還是另有隱情,我是刑警寧澤卜朗,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布拔第,位于F島的核電站,受9級特大地震影響场钉,放射性物質(zhì)發(fā)生泄漏蚊俺。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一逛万、第九天 我趴在偏房一處隱蔽的房頂上張望泳猬。 院中可真熱鬧,春花似錦、人聲如沸得封。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽忙上。三九已至拷呆,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間疫粥,已是汗流浹背茬斧。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留梗逮,地道東北人项秉。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像慷彤,于是被迫代替她去往敵國和親伙狐。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容