【原創(chuàng)】在NCBI查找指定物種基因組信息
生信分析中經(jīng)常需要查找指定物種的基因組信息啄刹。如:基因組相關(guān)分析中需要借助已有基因組輔助基因組組裝及基因預(yù)測(cè)佛舱;轉(zhuǎn)錄組同樣查找已有基因組作為參考基因組浦箱;宏基因組/宏轉(zhuǎn)錄組同樣需要查找基因組來(lái)剔除宿主數(shù)據(jù)惠豺,等等。疼燥。。
本文僅以目前最常用的綜合性基因組數(shù)據(jù)庫(kù) NCBI 為例,演示下基本的物種基因組檢索方法鹅很。
1、獲取物種拉丁名
這個(gè)方法有很多罪帖,最常見(jiàn)的百度百科就基本可以滿足絕大多數(shù)需求促煮。
以 小菜蛾 為例:
找到 “小菜蛾” 的拉丁名為:Plutella xylostella
2、NCBI檢索基因組
檢索數(shù)據(jù)庫(kù)選擇 Genome整袁;搜索框輸入物種拉丁名 “Plutella xylostella”?
點(diǎn)擊 Search 后會(huì)跳轉(zhuǎn)至 NCBI 推薦基因組菠齿,該基因組一般為組裝結(jié)果較好或注釋信息較全的基因組;
同時(shí)也可以看到坐昙,這里顯示本物種在NCBI中共收錄有7個(gè)基因組信息
3绳匀、全部基因組瀏覽
如果想要查看NCBI上關(guān)于本物種更多的基因組信息,可點(diǎn)擊上圖中的 “list” 鏈接:
進(jìn)一步跳轉(zhuǎn)至??“Plutella xylostella”? 全部基因組瀏覽頁(yè)面:
比較重要的幾列信息如下:
第 1 列:物種信息
第 3 列:亞種民珍、菌株等編號(hào)
第 6 列:對(duì)應(yīng)基因組Assembly編號(hào)襟士,點(diǎn)擊可直接跳轉(zhuǎn)對(duì)應(yīng)基因組信息頁(yè)
第 7 列:基因組組裝水平,一般選取 Chromosome 或?Complete Genome 水平基因組
第 8嚷量、9陋桂、12、14 列:基因組組裝大小蝶溶、GC含量嗜历、序列條數(shù)宣渗、更新時(shí)間等信息
第 13 列:基因組CDS預(yù)測(cè)結(jié)果,確實(shí)則表示該基因組未進(jìn)行CDS預(yù)測(cè)梨州,即缺失基因信息
在這里即可根據(jù)自身需求選擇合適的基因組進(jìn)行相關(guān)分析啦~