基因家族分析4 || 多序列比對和進化樹分析

基因家族流程:基因家族分析(一)
基因家族流程:基因家族分析(二)
基因家族流程:基因家族分析(三)

====================================================================================================================================

多序列比對和進化樹分析(Multiple sequences aligment and phylogenetic analysis)(有時間更新)

1.多序列比對分析

(1)DNAMAN(目前最新version10)

(2)ClustalW2&ClustalX2 (ClustalX2命令行版本)

  • 下載地址: http://www.clustal.org/
  • 使用: File- Load Sequence-Alignment- Alignment Parameters-Multiple Alignment Parameters- Alignment菜單塞蹭,選擇Output Format Options-擊Aliglnment菜單孽江,選擇Do Complete Alignment.

(3)命令行:

  • musle
  • clustalw
  • mattf

2.進化樹分析

  • MEGA網(wǎng)址:https://www.megasoftware.net/ #填簡單信息下載
  • 目前最新版到MEGAX(支持codon aliginment),7以上只提供64位番电。
  • 使用:File-Align-Alignment-Align By Muscle-Export Alignment-MEGA Format -Phylogeny-Construct/Test Neighbor-Joining Tree.
  • 注意:
    (1) 多序列比對:Muscle or clustalw
    (2) Model選擇.分別針對蛋白序列和核酸序列的模型選擇程序
    (3) 算法選擇岗屏。三種: NJ, ML and BI. 文獻中一般都是NJ(bootstrap1000)進化樹。一般ML(超級慢)樹比較準確漱办,但應(yīng)結(jié)合方法这刷,如NJ樹,相互驗證娩井。

意義:

a.聚類分析暇屋。如亞家族分類。像MAPKKK基因家族通過進化樹可以清楚分為MEKK,Raf和ZIK三個亞家族洞辣。
b.親緣關(guān)系鑒定咐刨。在進化樹上位于同一支的往往暗示這親緣關(guān)系很近。
c.基因家族復(fù)制分析屋彪。研究基因家族復(fù)制事件(duplication events):兩種復(fù)制事件類型(tandem duplication and segmental dulication)

3.其他建樹軟件

phyML
Mrbayes
...

4進化樹修飾

  1. MEGA:view->options and subtree-> draw options.

  2. AI美化所宰,可以添加任何元素绒尊。(強烈推薦)

  3. iTOL美化:可成以下效果畜挥,但是樹形較MEGA會變化,不推薦婴谱。
    iTOL: Interactive Tree Of Life: http://itol2.embl.de/
    iTOL: Upload a new tree:http://itol.embl.de/upload.cgi

文件準備:
從MEGA導(dǎo)出的nwk樹文件蟹但,上傳到iTOL,修改option
color ranges(基因背景色)
Datssets—color strip (即外圍條帶)

4)FigTree v1.4.3 http://tree.bio.ed.ac.uk/software/figtree/

繪制基因的染色體位置圖(Chromosomal Location)

1.準備文件

基因id
基因組的注釋文件
基因組染色體的長度
在線繪制工具:MapGene2Chrom:http://mg2c.iask.in/mg2c_v2.0/

2.獲取染色體長度

  1. samtools和awk提取所有染色體長度
    Athaliana_167_TAIR9.fa.fai文件中前兩列為染色體名字和長度文件
pengzw@super-server:~$ samtools faidx Athaliana_167_TAIR9.fa
pengzw@super-server:~$ awk '{print $1"\t"$2}' Athaliana_167_TAIR9.fa.fai >chr_length.txt 
pengzw@super-server:~$ cat chr_length.txt  #查看genome.fa.fai 文件谭羔,前兩列為染色體位置和長度
Chr1    30427671
Chr2    19698289
Chr3    23459830
Chr4    18585056
Chr5    26975502
ChrM    366924
ChrC    154478

3.獲取基因位置

awk初步提取位置和其他信息(可適當(dāng)添加)

pengzw@super-server:~/reference/At$ awk -F "[= \t]" '$3 == "gene" {print$11"\t"$4"\t"$5}' Athaliana_167_TAIR10.gene.gff3|head -n 5
AT1G01010   3631    5899
AT1G01020   5928    8737
AT1G01030   11649   13714
AT1G01040   23146   31227
AT1G01050   31170   33153

awk對兩個文件處理:按照名字篩選

awk 'NR==FNR{a[\$1]}NR!=FNR{if (\$1 in a) print $0}' id id.all > out 

命令解釋:NR==FNR和ARGIND==1和FILENAME=ARGV[1]表示第一個文件华糖,NR!=FNR和NR>FNR以及ARGIND==1和FILENAME=ARGV[2]都表示第二個文件

pengzw@super-server:~/reference/phytozome/at$ cat id
AT1G01010
AT1G01020
pengzw@super-server:~/reference/phytozome/at$ cat id.all
AT1G01010   3631    5899
AT1G01020   5928    8737
AT1G01030   11649   13714
AT1G01040   23146   31227
AT1G01050   31170   33153
pengzw@super-server:~/reference/phytozome/at$ awk 'NR==FNR{a[$1]}NR!=FNR{if ($1 in a) print $0}' id id.all > out 
pengzw@super-server:~/reference/phytozome/at$ cat out
AT1G01010   3631    5899
AT1G01020   5928    8737

4.繪制工具:

1)在線繪制工具:MapGene2Chrom:http://mg2c.iask.in/mg2c_v2.0/(推薦)
2)Mapchart&Mapdraw(沒試過,文獻中出現(xiàn))
3)MapInspect (超級煩瑣坑爹瘟裸,出圖效果還不好客叉,不更新了還)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子兼搏,更是在濱河造成了極大的恐慌卵慰,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,589評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件佛呻,死亡現(xiàn)場離奇詭異裳朋,居然都是意外死亡,警方通過查閱死者的電腦和手機吓著,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,615評論 3 396
  • 文/潘曉璐 我一進店門鲤嫡,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人绑莺,你說我怎么就攤上這事暖眼。” “怎么了纺裁?”我有些...
    開封第一講書人閱讀 165,933評論 0 356
  • 文/不壞的土叔 我叫張陵罢荡,是天一觀的道長。 經(jīng)常有香客問我对扶,道長区赵,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,976評論 1 295
  • 正文 為了忘掉前任浪南,我火速辦了婚禮笼才,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘络凿。我一直安慰自己骡送,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,999評論 6 393
  • 文/花漫 我一把揭開白布絮记。 她就那樣靜靜地躺著摔踱,像睡著了一般。 火紅的嫁衣襯著肌膚如雪怨愤。 梳的紋絲不亂的頭發(fā)上派敷,一...
    開封第一講書人閱讀 51,775評論 1 307
  • 那天,我揣著相機與錄音撰洗,去河邊找鬼篮愉。 笑死,一個胖子當(dāng)著我的面吹牛差导,可吹牛的內(nèi)容都是我干的试躏。 我是一名探鬼主播,決...
    沈念sama閱讀 40,474評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼设褐,長吁一口氣:“原來是場噩夢啊……” “哼颠蕴!你這毒婦竟也來了泣刹?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,359評論 0 276
  • 序言:老撾萬榮一對情侶失蹤犀被,失蹤者是張志新(化名)和其女友劉穎项玛,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體弱判,經(jīng)...
    沈念sama閱讀 45,854評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡襟沮,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,007評論 3 338
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了昌腰。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片开伏。...
    茶點故事閱讀 40,146評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖遭商,靈堂內(nèi)的尸體忽然破棺而出犁罩,到底是詐尸還是另有隱情值戳,我是刑警寧澤溜畅,帶...
    沈念sama閱讀 35,826評論 5 346
  • 正文 年R本政府宣布钦无,位于F島的核電站,受9級特大地震影響祠汇,放射性物質(zhì)發(fā)生泄漏仍秤。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,484評論 3 331
  • 文/蒙蒙 一可很、第九天 我趴在偏房一處隱蔽的房頂上張望诗力。 院中可真熱鬧,春花似錦我抠、人聲如沸苇本。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,029評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽瓣窄。三九已至,卻和暖如春纳鼎,著一層夾襖步出監(jiān)牢的瞬間俺夕,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,153評論 1 272
  • 我被黑心中介騙來泰國打工喷橙, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留啥么,地道東北人登舞。 一個月前我還...
    沈念sama閱讀 48,420評論 3 373
  • 正文 我出身青樓贰逾,卻偏偏與公主長得像,于是被迫代替她去往敵國和親菠秒。 傳聞我的和親對象是個殘疾皇子疙剑,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,107評論 2 356

推薦閱讀更多精彩內(nèi)容