perl腳本練習(xí):整理GO ID & go2germ

前言

廣告時(shí)間:覺得推文有用的霎肯,可以看下我的個(gè)人簡(jiǎn)介钾菊,關(guān)注下~

今天的腳本純粹是練習(xí)下perl的操作符了骂维,因?yàn)槲視簳r(shí)還不知道將這個(gè)流程能鑲嵌到哪里蚌父。

將一個(gè)“gene” ID 與多個(gè)GO ID 轉(zhuǎn)換為一行一個(gè)“gene” ID與一個(gè)GO ID哮兰,用perl腳本實(shí)現(xiàn)。但是只做格式整理苟弛,總覺得差點(diǎn)什么喝滞,所以用TBtools的功能“GO Term Parse”,當(dāng)然膏秫,這部分功能我還不會(huì)用perl腳本直接實(shí)現(xiàn)右遭。

這里用的輸入文件為Trinotate注釋的結(jié)果文件Trinotate.xls.gene_ontology

內(nèi)容式這個(gè)樣子的缤削,兩列直接以制表符分割窘哈。

格式.png

腳本運(yùn)行

運(yùn)行腳本

perl goID_one_per_line.pl Trinotate.xls.gene_ontology  one_per_line.txt

檢查結(jié)果GO ID數(shù)目是否與原文件相同

#檢查結(jié)果文件one_per_line.txt 種GO ID數(shù)
wc -l one_per_line.txt
#檢查輸入文件Trinotate.xls.gene_ontology的 GO ID數(shù)
grep -o 'GO:' Trinotate.xls.gene_ontology | wc -l

結(jié)果文件one_per_line.txt 內(nèi)容展示

one_per_line.png

腳本代碼

#!/usr/bin/perl -w

# Name:goID_one_per_line.pl
# Usage:
# perl goID_one_per_line.pl input_file output_file

use strict;

my $usage = "\nUsage:\nperl $0 input_file output_file\n";

die $usage unless @ARGV == 2; 

open GO,'<',"$ARGV[0]" || die $usage;
open OUT,'>',"$ARGV[1]" || die $usage;
while(<GO>){
   next if /^\s+$/; #為什么要位于"chomp;"行前呢?
   chomp;
   my ($seqid,$goid) = split /\t/,$_;
    #print "$seqid\n";
    #print "$goid\n";
    my @goid = split /,/,$goid;
    while (<@goid>){  #非空為真亭敢,空為假滚婉;while為循環(huán),if不是循環(huán)帅刀。
        my $one_goid = shift @goid; #注意理解此時(shí)$one_goid 與@goid內(nèi)容让腹。
        print OUT "$seqid\t$one_goid\n";
    }
}

close GO;
close OUT;

使用TBtools實(shí)現(xiàn)go2term

打開TBtools的GO Term Parse 功能

go term parse.png
TBtools過程.png

結(jié)果文件如下:

兩個(gè)結(jié)果文件內(nèi)容相同,就是列的位置不同扣溺。如果結(jié)果文件過大骇窍,excel可能無法直接打開,可以使用vscode或者TBtoolsBig File Previewer 功能打開锥余。

結(jié)果文件.png

其中結(jié)果文件one_per_line.txt.Parsed.Gene2Go.xls 部分內(nèi)容如下

go2term結(jié)果.png

總結(jié)

  1. 代碼的理解上
   next if /^\s+$/; #為什么要位于chomp;行前呢腹纳?
   chomp;

代碼第16行的匹配理解還是不夠,暫時(shí)不是很明白為什么第16、17行不能調(diào)換位置嘲恍。

  1. while是循環(huán)足画,但if不是。循環(huán)在@goid中取值時(shí)第一次寫成了if蛔钙。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末锌云,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子吁脱,更是在濱河造成了極大的恐慌桑涎,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,122評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件兼贡,死亡現(xiàn)場(chǎng)離奇詭異攻冷,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)遍希,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門等曼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人凿蒜,你說我怎么就攤上這事禁谦。” “怎么了废封?”我有些...
    開封第一講書人閱讀 164,491評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵州泊,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我漂洋,道長(zhǎng)遥皂,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,636評(píng)論 1 293
  • 正文 為了忘掉前任刽漂,我火速辦了婚禮演训,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘贝咙。我一直安慰自己样悟,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,676評(píng)論 6 392
  • 文/花漫 我一把揭開白布庭猩。 她就那樣靜靜地躺著乌奇,像睡著了一般。 火紅的嫁衣襯著肌膚如雪眯娱。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,541評(píng)論 1 305
  • 那天爬凑,我揣著相機(jī)與錄音徙缴,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛于样,可吹牛的內(nèi)容都是我干的疏叨。 我是一名探鬼主播,決...
    沈念sama閱讀 40,292評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼穿剖,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼蚤蔓!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起糊余,我...
    開封第一講書人閱讀 39,211評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤秀又,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后贬芥,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體吐辙,經(jīng)...
    沈念sama閱讀 45,655評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,846評(píng)論 3 336
  • 正文 我和宋清朗相戀三年蘸劈,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了昏苏。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,965評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡威沫,死狀恐怖贤惯,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情棒掠,我是刑警寧澤孵构,帶...
    沈念sama閱讀 35,684評(píng)論 5 347
  • 正文 年R本政府宣布,位于F島的核電站句柠,受9級(jí)特大地震影響浦译,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜溯职,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,295評(píng)論 3 329
  • 文/蒙蒙 一精盅、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧谜酒,春花似錦叹俏、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至述么,卻和暖如春蝌数,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背度秘。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工顶伞, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,126評(píng)論 3 370
  • 正文 我出身青樓唆貌,卻偏偏與公主長(zhǎng)得像滑潘,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子锨咙,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,914評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容