前面推文已經(jīng)把家族基因的成員確定了香璃,現(xiàn)在對這些成員做一些基本的分析这难,包括1.理化性質(zhì)分析、親/疏水性葡秒,有無信號肽/跨膜結(jié)構(gòu)域和亞細(xì)胞定位姻乓。做成表格,其他分析大都圖片形式)2.基因染色體分布情況3.基因結(jié)構(gòu)分析(外顯子內(nèi)含子分布及數(shù)量)眯牧、基序分布和保守結(jié)構(gòu)域分析(與確定家族成員重復(fù)蹋岩,可視化更為直觀,如果家族基因數(shù)量不多可以把兩張圖合并)学少。
1. 基因家族成員基本分析:A.理化性質(zhì)的分析(分子量剪个,等電點(diǎn),不穩(wěn)定指數(shù)版确,總平均親水性扣囊,脂肪指數(shù)等,根據(jù)自己分析需要整理)B.親疏水性 C.跨膜區(qū)分析 D.信號肽預(yù)測 E.亞細(xì)胞定位
B.https://web.expasy.org/protparam/ (在理化性質(zhì)的結(jié)果頁面GRAVY數(shù)值顯示绒疗,預(yù)測蛋白質(zhì)中所有氨基酸的親水性值總和÷氨基酸殘基數(shù)量)侵歇。
https://web.expasy.org/protscale/(結(jié)果圖片形式顯示,縱坐標(biāo)Score吓蘑,大于0表示疏水性惕虑,小于0表示親水性)。
C.http://www.cbs.dtu.dk/services/TMHMM/(結(jié)果頁面Number of predicted TMHs數(shù)值顯示有幾個磨镶,包括具體信息附有圖片)
D.https://services.healthtech.dtu.dk/service.php?SignalP(結(jié)果頁面Prediction: Other)
E.http://cello.life.nctu.edu.tw/cgi/main.cgi(結(jié)果頁面顯示CELLO Prediction不同數(shù)值顯示)
2.基因染色體分布情況(簡單來說枷遂,栽培花生有20條染色體,基因家族成員在這些染色體上分布是否位于兩端?每條染色體上的數(shù)目是否一樣棋嘲,哪條染色體上基因家族成員的數(shù)量最多/少?)
(1)Graphics→Show Genes on Chromosome→Gene Location Visualize from GTF/GFF→拖入基因組注釋文件(.gff3/.gtf)和所有基因家族成員的基因ID(串聯(lián)重復(fù)基因有也可顯示)
(2)每條染色體上家族成員的數(shù)量可自行統(tǒng)計(jì)做圖,看對文章分析的重要和完整性而定
3.基因結(jié)構(gòu)分析矩桂、基序和保守結(jié)構(gòu)域分析(如果基因家族成員不多沸移,基因結(jié)構(gòu),基序和保守結(jié)構(gòu)域和進(jìn)化樹可以合并可視化侄榴,從而對家族成員的鑒定進(jìn)行再次確認(rèn))
(1)Graphics→Bio Sequence Structure Illustrator→Gene Structure View(Advanced)→拖入相應(yīng)準(zhǔn)備的文件雹锣,右側(cè)參數(shù)可以自行設(shè)置與摸索(根據(jù)自己分析需求選擇單一或整合模塊)。
需要準(zhǔn)備相應(yīng)文件:A.基因組注釋文件(顯示基因結(jié)構(gòu)分布)B.進(jìn)化樹的樹文本文件(MEGA進(jìn)行多序列比對后保存)C. MEME網(wǎng)站預(yù)測直接保存的基序分布文件mast.xml D. 保守結(jié)構(gòu)域文本文件需要自行整理(包含基因ID癞蚕、起始位置蕊爵、結(jié)束位置和結(jié)構(gòu)域名稱Gene/From/To/Short name)
家族成員基本性質(zhì)的分析涉及的圖片較多,保存時盡量選擇高分辨率以上(本人投稿雜志社要求彩圖在600dpi以上)桦山,不然返圖確實(shí)很麻煩攒射。