19.大麥不同基因版本id轉化

方法一、 少數基因可以利用網站直接進行替換

主要用的網站
ensemble plant Hordeum_vulgare - Ensembl Genomes 53
BARLE Gene View (ipk-gatersleben.de)這個網站主要是下載基因序列

image.png

可以選擇V1版本-V3版本惨险。
大麥的數據有兩年沒搞了,一轉頭參考基因組都發(fā)到了V3版本钙皮,這個麥類研究也是激烈簡直摻不忍睹!M缇觥6烫酢!
GalaxyGalaxy (ipk-gatersleben.de)
這個網站主要的作用是對一段基因序列能夠進行多個版本基因的blast擎值,這個功能要比ensemble plant上要好用慌烧,但是比起兩年前的網站,這個網站的可操作沒有那么流暢鸠儿,這個網站的使用鼓搗了好久屹蚊。交互性太差。但好在學習后就能使用进每,就不吐槽了汹粤。下邊是兩年前的使用方法。
image.png

現(xiàn)在這個網站的使用方法
image.png

第一步 序列獲取

1.這個網站需要上傳自己需要blast的序列田晚,這個序列要在上邊的BARLE上去尋找嘱兼,數據的格式可以選擇文件,也可以使用直接粘貼的方式贤徒;
2.這個序列將需要找的基因的序列在linux系統(tǒng)中對fasta序列按照基因名字進行批量提取芹壕,這個方法明天試試再把代碼貼上。

第二步 序列上傳

image.png

點擊粘貼數據或鏈接接奈,然后修改2地方的名字踢涌;也可以點擊本地上傳;

第三步 進行blast

image.png

最后結果會在右邊展示

方法二序宦、 對不同版本的CDS序列進行批量blast

第一步 下載不同大麥版本的CDS序列

Galaxy (ipk-gatersleben.de)

image.png

V3版本的是從ensemble plant 下載的

##下載CDS序列
wget http://ftp.ensemblgenomes.org/pub/plants/release-53/fasta/hordeum_vulgare/cds/Hordeum_vulgare.MorexV3_pseudomolecules_assembly.cds.all.fa.gz
##解壓
gunzip  http://ftp.ensemblgenomes.org/pub/plants/release-53/fasta/hordeum_vulgare/cds/Hordeum_vulgare.MorexV3_pseudomolecules_assembly.cds.all.fa.gz
##建庫
##軟件的位置在/u2/software/NCBI_blast/ncbi-blast/bin/
makeblastdb -in Hordeum_vulgare.MorexV3_pseudomolecules_assembly.cds.all.fa -dbtype nucl -out morex_v3 -parse_seqids


建庫結束后會出來


image.png

依據自己的基因對應的版本睁壁,對不同版本的CDS提取
參考(21條消息) 根據序列ID提取fasta序列周欣5518的博客-CSDN博客根據序列名提取序列,一下代碼全部是這個大佬的博文中的

# 用grep命令匹配所有有>號的行,即所有序列名字的行潘明,然后另存為文件 ITS_all.name
 
grep ">" Hordeum_vulgare.MorexV3_pseudomoleculesassembly.cds.all.fa >morex_v3_all.name                                                                     
 
## 用sed查找>行剂,并把所有>號刪除
sed 's/>//g' morex_v3_all.name >morex_v3.name.txt

將這個文件下載到window電腦上

image.png

用excel打開后只有標1的那一列,添加左邊的一列(查看基因有幾個字節(jié)钳降,用left提群裨住),第三列是自己的目標基因牲阁,第四列用vlookup查找第一列的內容固阁,然后將第四列內容粘貼到linux新建的get_CDS.name文件里面去

# 在windows下的格式在Linux環(huán)境下可能不識別需要轉換格式
 
dos2unix get_CDS.name

## 用perl小程序進行提取
perl ./extract.pl get_CDS.name Hordeum_vulgare.MorexV3_pseudomoleculesassembly.cds.all.fa > select.gen.CDS.fa

image.png
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末壤躲,一起剝皮案震驚了整個濱河市城菊,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌碉克,老刑警劉巖凌唬,帶你破解...
    沈念sama閱讀 211,376評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異漏麦,居然都是意外死亡客税,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,126評論 2 385
  • 文/潘曉璐 我一進店門撕贞,熙熙樓的掌柜王于貴愁眉苦臉地迎上來更耻,“玉大人,你說我怎么就攤上這事捏膨⊙砭” “怎么了?”我有些...
    開封第一講書人閱讀 156,966評論 0 347
  • 文/不壞的土叔 我叫張陵号涯,是天一觀的道長目胡。 經常有香客問我蜡娶,道長瓢湃,這世上最難降的妖魔是什么帽氓? 我笑而不...
    開封第一講書人閱讀 56,432評論 1 283
  • 正文 為了忘掉前任以故,我火速辦了婚禮梢卸,結果婚禮上爷抓,老公的妹妹穿的比我還像新娘挨下。我一直安慰自己侠仇,他們只是感情好霉祸,可當我...
    茶點故事閱讀 65,519評論 6 385
  • 文/花漫 我一把揭開白布筑累。 她就那樣靜靜地躺著,像睡著了一般脉执。 火紅的嫁衣襯著肌膚如雪疼阔。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,792評論 1 290
  • 那天,我揣著相機與錄音婆廊,去河邊找鬼迅细。 笑死,一個胖子當著我的面吹牛淘邻,可吹牛的內容都是我干的茵典。 我是一名探鬼主播,決...
    沈念sama閱讀 38,933評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼宾舅,長吁一口氣:“原來是場噩夢啊……” “哼统阿!你這毒婦竟也來了?” 一聲冷哼從身側響起筹我,我...
    開封第一講書人閱讀 37,701評論 0 266
  • 序言:老撾萬榮一對情侶失蹤扶平,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后蔬蕊,有當地人在樹林里發(fā)現(xiàn)了一具尸體结澄,經...
    沈念sama閱讀 44,143評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,488評論 2 327
  • 正文 我和宋清朗相戀三年岸夯,在試婚紗的時候發(fā)現(xiàn)自己被綠了麻献。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,626評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡猜扮,死狀恐怖勉吻,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情旅赢,我是刑警寧澤齿桃,帶...
    沈念sama閱讀 34,292評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站鲜漩,受9級特大地震影響源譬,放射性物質發(fā)生泄漏。R本人自食惡果不足惜孕似,卻給世界環(huán)境...
    茶點故事閱讀 39,896評論 3 313
  • 文/蒙蒙 一踩娘、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧喉祭,春花似錦养渴、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至蔽氨,卻和暖如春藐唠,著一層夾襖步出監(jiān)牢的瞬間帆疟,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工宇立, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留踪宠,地道東北人。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓妈嘹,卻偏偏與公主長得像柳琢,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子润脸,可洞房花燭夜當晚...
    茶點故事閱讀 43,494評論 2 348