生信小白如何在短短半年收到核心期刊的錄用證明順畢業(yè)=嫡!囚霸!
本人農(nóng)林院校的專碩研究生腰根,學(xué)制2.5年,畢業(yè)要求是一篇核心及以上或者專利拓型。碩士期間課題換了兩次额嘿,實驗數(shù)據(jù)不能支持發(fā)一篇研究論文,前期大量時間荒廢沒有知識儲備寫出綜述劣挫,結(jié)合課題只能做一個物種的生信分析册养,保證畢業(yè)。當(dāng)我知道這篇文章是我的“救命稻草”后压固,就開始瘋狂問同學(xué)球拦,找公眾號,去b站……2021年5月22日買了陳程杰老師的基因家族分析課程帐我,2021年8月24日完成論文的初稿坎炼,2021年11月29日收到投稿雜志的錄用證明。
圖中是用到的大部分軟件和網(wǎng)站拦键,使用最多的是TBtools也就是陳老師開發(fā)的強大的生物信息學(xué)分析工具(包括序列的提取谣光,引物設(shè)計,基因結(jié)構(gòu)保守域的可視化……總之功能很多芬为,只有你不會用萄金,而且軟件一直在更新,免費的媚朦,大家可以自行搜索“生信藥丸”公眾號捡絮,使用講解的很全面,保姆級別了)莲镣;其余一些使用頻率不是那么高的,VMD是蛋白三級結(jié)構(gòu)模型預(yù)測的可視化軟件涎拉,細節(jié)很足瑞侮,可以自行探索的圆;figtree和網(wǎng)站iTOL都是進化樹的可視化,因為本人的基因家族成員接近400左右半火,實在很大越妈,圖片如果要清楚美觀選擇了后者,figtree應(yīng)該也可以钮糖,但是本人未能摸透就放棄了梅掠;Jalview可以進行多序列的比對,對于其中的一些氨基酸位點可以根據(jù)需要用不同顏色進行高亮顯示店归;MEGA可以序列比對再生成進化樹阎抒,如果選擇其他美化修飾軟件,也是需要MEGA氨基酸序列比對后保存相關(guān)文件(.meg/.mtxs)導(dǎo)入才可消痛。當(dāng)然且叁,還有其他的許多軟件和網(wǎng)站,根據(jù)分析的需求進行選擇和組合都是沒有問題的秩伞。
本人的基因家族分析大體包括三個部分逞带,基因家族成員的鑒定、基本理化性質(zhì)的分析和家族成員進化分析纱新。其中展氓,基因家族成員的鑒定最為重要,也是反反復(fù)復(fù)比對后才確認脸爱。
首先遇汞,基因家族成員的鑒定包括:1. 研究的基因家族家族成員的基本特征確定(參考已有物種,我研究的是栽培花生阅羹,參考的是模式植物擬南芥勺疼,擬南芥二倍體植物,2n=10捏鱼,該基因家族成員有100個左右执庐,花生異源四倍體作物,2n=40导梆,預(yù)估200以上轨淌,400左右)2. 目標(biāo)物種序列和注釋信息的下載(花生和擬南芥的基因組文件,基因組注釋文件看尼,共4個文件)3. 雙向Blast比對獲取可能的成員(TBtools軟件進行提取后递鹉,上傳序列至ncbi batch cdd/pfam/hmmer基于保守結(jié)構(gòu)域進一步篩選)。
其次藏斩,是基因家族成員的基本分析包括1.成員理化性質(zhì)分析(分子量躏结,等電點,親/疏水性狰域,有無信號肽/跨膜結(jié)構(gòu)域和亞細胞定位媳拴』崎伲可以做成表格,其他分析大都是圖片的形式)2.基因染色體分布情況(成員在染色體上的分布做成圖屈溉,每條染色體上基因成員的數(shù)量也可以統(tǒng)計做圖)3.基因結(jié)構(gòu)分析(外顯子內(nèi)含子分布及數(shù)量)和保守結(jié)構(gòu)域分析(與確定家族成員重復(fù)塞关,可視化更為直觀,如果家族基因數(shù)量不多可以把兩張圖合并)帆赢。
最后,基因家族成員的進化分析椰于,包括1.進化樹構(gòu)建與可視化(本人研究基因家族成員較大缠导,亞家族分類與參考(擬南芥)/已知(水稻廉羔、小麥、葡萄和櫟樹)物種較為一致僻造,暗示結(jié)果具有一定可靠性)2.物種內(nèi)的共線性分析(可以看基因是否存在串聯(lián)重復(fù))3.不同物種之間的共線性分析(研究種間基因組同源性程度憋他,抄過來的髓削,通俗的理解是目標(biāo)物種為A,現(xiàn)在做了ABC三個物種的共線性立膛,其中AB共線性數(shù)量多于AC揪罕,說明A和B的親緣關(guān)系更近)。
當(dāng)然宝泵,以上內(nèi)容僅為最基礎(chǔ)的部分好啰,其他更深入全面的分析如啟動子的預(yù)測儿奶,三級結(jié)構(gòu)模型的預(yù)測,部分實驗qRT-PCR等等椰弊。如果你想發(fā)一篇好文章瓤鼻,這遠遠是不夠的,只能說越早開始越好茬祷。以上是內(nèi)容大概,后期發(fā)布詳細分析過程。