linux腳本 | 去除系統(tǒng)發(fā)育樹的支長和節(jié)點信息

介紹

系統(tǒng)發(fā)育樹文件通常帶有支長和節(jié)點信息,如遺傳距離偏窝、位點數(shù)收恢、支持率、分化時間等等祭往,生成這樣的信息一般是通過軟件基于序列信息計算得到的派诬。而在某些情況,我們需要刪除這些信息链沼,將其還原成一個不帶有支長和節(jié)點信息的純粹拓?fù)浣Y(jié)構(gòu)樹文件默赂。當(dāng)分支過多無法手動刪除時,可以使用以下腳本完成:
原樹文件:

cat TREE.tre
(AB3039501:0.1407725357,((((((((AY4585951:0.1852444343,((KT8787191:0.0766471312,NC_0394111:0.0629126169)71.8/76:0.0212697120,NC_0200441:0.0738918614)100/100:0.0885191625)100/100:0.0828170616,NC_0323171:0.3396258972)99.8/100:0.0417881180,((JX5648861:0.3478457331,(MG0207721:0.2975091274,MG0207811:0.1848243312)100/100:0.0550933889)97.8/62:0.0237904467,((MG0207651:0.5194304916,MZ7510421:0.7398126943)98.5/56:0.0542524672,(NC_0187711:0.7497611531,NC_0323481:0.3138779842)94.4/60:0.0488882269)50/40:0.0237393404)100/100:0.0456730453)100/100:0.0522125255,NC_0323471:0.2425934555)100/100:0.0725292382,KT2858021:0.2341185025)99.9/100:0.0401796690,(KF7981951:0.2419142919,MF4962411:0.2327977799)61.7/62:0.0262765906)100/100:0.0487023558,AY4585961:0.1934500376)100/100:0.0465872157,SL454:0.1630815831)100/100:0.0443615170,MF5387871:0.0939151778);c
 cat TREE.tre | 
sed 's/,/[,/g' | 
sed 's/:/[:/g' | 
sed 's/)/[)/g'| 
awk -F, 'BEGIN{RS="["}{print }' | 
grep -v ":" | 
sed 's/)/)[/g' | 
awk -F, 'BEGIN{FS="["}{print $1}' | 
awk -F, 'BEGIN{ORS=" "}{print}' | 
sed 's/ //g'

去除支長和節(jié)點信息后的樹文件:

(AB3039501,((((((((AY4585951,((KT8787191,NC_0394111),NC_0200441)),NC_0323171),((JX5648861,(MG0207721,MG0207811)),((MG0207651,MZ7510421),(NC_0187711,NC_0323481)))),NC_0323471),KT2858021),(KF7981951,MF4962411)),AY4585961),SL454),MF5387871)

注意:一般樹文件后會有分號(英文符號“;”)結(jié)尾括勺,跑完這個代碼后缆八,分號會丟失。分號在很多時候并非必要的疾捍,比如這個新的樹文件仍然可以用FigTree打開奈辰。不過如果用以后續(xù)分析時,要注意格式中是否需要開頭或結(jié)尾的符號乱豆,可以手動添加奖恰。
最終的樹形態(tài):

clean_TREE.tre.jpg

無根樹

該樹形特點即所有樹的支長是相同的。這種樹屬于無根樹宛裕,該樹僅反應(yīng)系統(tǒng)發(fā)育樹中各個支系的拓?fù)潢P(guān)系瑟啃,但不表征相對遺傳距離,分歧時間以及共同祖先揩尸。作為系統(tǒng)發(fā)育關(guān)系的示意圖展示就可以使用不帶有支長信息的無根樹蛹屿,另外,一些軟件分析時也會要求提供只含有拓?fù)浣Y(jié)構(gòu)的先驗樹岩榆。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末错负,一起剝皮案震驚了整個濱河市坟瓢,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌犹撒,老刑警劉巖折联,帶你破解...
    沈念sama閱讀 216,470評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異识颊,居然都是意外死亡诚镰,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,393評論 3 392
  • 文/潘曉璐 我一進(jìn)店門谊囚,熙熙樓的掌柜王于貴愁眉苦臉地迎上來怕享,“玉大人执赡,你說我怎么就攤上這事镰踏。” “怎么了沙合?”我有些...
    開封第一講書人閱讀 162,577評論 0 353
  • 文/不壞的土叔 我叫張陵奠伪,是天一觀的道長。 經(jīng)常有香客問我首懈,道長绊率,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,176評論 1 292
  • 正文 為了忘掉前任究履,我火速辦了婚禮滤否,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘最仑。我一直安慰自己藐俺,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,189評論 6 388
  • 文/花漫 我一把揭開白布泥彤。 她就那樣靜靜地躺著欲芹,像睡著了一般。 火紅的嫁衣襯著肌膚如雪吟吝。 梳的紋絲不亂的頭發(fā)上菱父,一...
    開封第一講書人閱讀 51,155評論 1 299
  • 那天,我揣著相機(jī)與錄音剑逃,去河邊找鬼浙宜。 笑死,一個胖子當(dāng)著我的面吹牛蛹磺,可吹牛的內(nèi)容都是我干的梆奈。 我是一名探鬼主播,決...
    沈念sama閱讀 40,041評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼称开,長吁一口氣:“原來是場噩夢啊……” “哼亩钟!你這毒婦竟也來了乓梨?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,903評論 0 274
  • 序言:老撾萬榮一對情侶失蹤清酥,失蹤者是張志新(化名)和其女友劉穎扶镀,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體焰轻,經(jīng)...
    沈念sama閱讀 45,319評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡臭觉,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,539評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了辱志。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蝠筑。...
    茶點故事閱讀 39,703評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖揩懒,靈堂內(nèi)的尸體忽然破棺而出什乙,到底是詐尸還是另有隱情,我是刑警寧澤已球,帶...
    沈念sama閱讀 35,417評論 5 343
  • 正文 年R本政府宣布臣镣,位于F島的核電站,受9級特大地震影響智亮,放射性物質(zhì)發(fā)生泄漏忆某。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,013評論 3 325
  • 文/蒙蒙 一阔蛉、第九天 我趴在偏房一處隱蔽的房頂上張望弃舒。 院中可真熱鬧,春花似錦状原、人聲如沸聋呢。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,664評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽坝冕。三九已至,卻和暖如春瓦呼,著一層夾襖步出監(jiān)牢的瞬間喂窟,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,818評論 1 269
  • 我被黑心中介騙來泰國打工央串, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留磨澡,地道東北人。 一個月前我還...
    沈念sama閱讀 47,711評論 2 368
  • 正文 我出身青樓质和,卻偏偏與公主長得像稳摄,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子饲宿,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,601評論 2 353

推薦閱讀更多精彩內(nèi)容