在生物學(xué)分析中降铸,我們經(jīng)常會(huì)針對(duì)某個(gè)基因進(jìn)行生物學(xué)功能分析,比較常見(jiàn)的包括基因結(jié)構(gòu)預(yù)測(cè)摇零,功能注釋推掸,蛋白質(zhì)結(jié)構(gòu)域預(yù)測(cè)(跨膜域,信號(hào)肽)驻仅,同源基因分析谅畅,多序列比對(duì),亞細(xì)胞定位預(yù)測(cè)噪服,啟動(dòng)子序列分析毡泻,調(diào)控靶基因的miRNA預(yù)測(cè)等。在“單個(gè)基因的生物信息學(xué)分析”主題中粘优,我們主要使用的是在線網(wǎng)站牙捉,幾乎不涉及編程等操作,這樣會(huì)使跟多的同學(xué)可以方便學(xué)習(xí)敬飒。
一邪铲、針對(duì)一個(gè)特定的基因序列,首先我們要分析其基因結(jié)構(gòu)无拗。這里我們推薦的是softberry網(wǎng)站的子功能带到,即FGENESH。
該分析工具的網(wǎng)址如下FGENESH - HMM-based gene structure prediction
進(jìn)入該網(wǎng)址之后英染,輸入該基因的fasta序列揽惹,關(guān)于目標(biāo)基因的fasta序列,fig.1即為所示四康,我們以小麥中的基因?yàn)槔治觥?/p>
根據(jù)fig.2所示搪搏,將fasta序列輸入進(jìn)去,選擇小麥(triticum aestivum)闪金,然后search疯溺。
圖3展示了分析結(jié)果论颅,可以看到我們這個(gè)序列比對(duì)到了正義鏈,因?yàn)槲覀冇玫睦邮窃摶虻霓D(zhuǎn)錄本囱嫩,所以只包括黃色的部分恃疯,即CDSo序列,這也和我們使用的轉(zhuǎn)錄本相吻合墨闲。下面的是該基因?qū)?yīng)的mRNA序列今妄,同樣也是1152bp,最下面的是將該mRNA翻譯為蛋白質(zhì)的序列鸳碧。
二盾鳞、如果我們是想分析一段區(qū)間內(nèi)的基因結(jié)構(gòu),例如幾kb瞻离,幾十kb腾仅,而不是針對(duì)特定的基因分析,同樣也可以使用該網(wǎng)址琐脏。這里我們使用的是FGENESH的示例文件。
同樣選擇好序列和物種缸兔,搜索日裙,等待結(jié)果。
圖5是分析結(jié)果惰蜜,一共鑒定了10個(gè)基因昂拂,21個(gè)外顯子,由于篇幅所限抛猖,我們只展示了前幾個(gè)格侯,但是統(tǒng)計(jì)的話,正好能對(duì)上數(shù)目财著。
圖6是緊接上圖的具體的序列分析联四,總共包含10個(gè)基因。
三撑教、基于以上分析朝墩,我們可以初步得到一段區(qū)間內(nèi)的基因結(jié)構(gòu)分析,也可以進(jìn)行單個(gè)基因的結(jié)構(gòu)分析伟姐。完成基因結(jié)構(gòu)分析之后收苏,可以利用ncbi的blast,或者ensemble plant進(jìn)行功能注釋愤兵,如果是使用氨基酸序列鹿霸,選擇blastp,如果是基因序列秆乳,選擇blastn懦鼠。圖7顯示的是ensemble plant的blast,查看其在擬南芥中的同源基因。在這里葛闷,我比較推薦使用ensemble plant進(jìn)行blast憋槐,因?yàn)樵摼W(wǎng)址更簡(jiǎn)潔,明了淑趾。
圖8可以看到該基因在擬南芥中的同源基因阳仔,具體的生物學(xué)注釋,就要看自己對(duì)這個(gè)基因的了解程度了扣泊。