生物信息序列格式的批量修改與生物信息序列文件格式的轉(zhuǎn)換

序列格式轉(zhuǎn)化推薦看看SeqKit,TBtools等已有軟件,能用則用撞秋。

fasta格式轉(zhuǎn)fastq格式

  • 比對軟件比如bowtie并不支持比對fasta格式的文件,所以需要把fasta轉(zhuǎn)為fastq格式嚣鄙,但是fasta和fastq相比缺少質(zhì)量值吻贿,所以只能偽造一個加上去,這里用到seqtk來偽造哑子,從而把fasta格式轉(zhuǎn)fastq格式舅列。作者:今天沒回家
    seqtk seq test.fa -F "J" > test.fq

參考文章

批量修改fasta文件的序列名

轉(zhuǎn)載自BioInfo Voyager的博客,感謝他的分享卧蜓!

    1. 準(zhǔn)備輸入的fasta序列文件input_file(要求序列名中不包含第二步輸入序列集的分隔符)
    1. 準(zhǔn)備輸入的替換集replace_file, 兩列帐要,/t分隔(分隔符可以在腳本里修改)
    1. 使用以下python腳本,保存腳本為change_fa_name.py(腳本名稱可以自定義)弥奸。
from sys import argv
import sys
 
input_file = argv[1]
replace_file = argv[2]
output_file = argv[3]
 
with open(input_file, 'r') as f:
    fasta_lines = f.readlines()
 
replacements = {}
with open(replace_file, 'r') as f:
    for line in f:
        (old_str, new_str) = line.strip().split('\t')
        replacements[old_str] = new_str
 
with open(output_file, 'w') as f:
    for line in fasta_lines:
        if line.startswith('>'):
            seq_id = line.split('>')[1].strip()
            if seq_id in replacements: 
                new_seq_id = replacements[seq_id]
                line = line.replace(seq_id, new_seq_id)
                f.write(line)
            else:
                print(seq_id + ' is not in the replacement set, the program exits running, please check your replacement set!')
                sys.exit()
        else:
            f.write(line)

保存腳本并運行

python change_fa_name.py input_file replace_file output_file
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末榨惠,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子盛霎,更是在濱河造成了極大的恐慌赠橙,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件愤炸,死亡現(xiàn)場離奇詭異期揪,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)规个,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進(jìn)店門凤薛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人诞仓,你說我怎么就攤上這事缤苫。” “怎么了墅拭?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵活玲,是天一觀的道長。 經(jīng)常有香客問我帜矾,道長翼虫,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任屡萤,我火速辦了婚禮珍剑,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘死陆。我一直安慰自己招拙,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布措译。 她就那樣靜靜地躺著别凤,像睡著了一般。 火紅的嫁衣襯著肌膚如雪领虹。 梳的紋絲不亂的頭發(fā)上规哪,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天,我揣著相機(jī)與錄音塌衰,去河邊找鬼诉稍。 笑死,一個胖子當(dāng)著我的面吹牛最疆,可吹牛的內(nèi)容都是我干的杯巨。 我是一名探鬼主播,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼努酸,長吁一口氣:“原來是場噩夢啊……” “哼服爷!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起获诈,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤仍源,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后烙荷,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體镜会,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年终抽,在試婚紗的時候發(fā)現(xiàn)自己被綠了戳表。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡昼伴,死狀恐怖匾旭,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情圃郊,我是刑警寧澤价涝,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站持舆,受9級特大地震影響色瘩,放射性物質(zhì)發(fā)生泄漏伪窖。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一居兆、第九天 我趴在偏房一處隱蔽的房頂上張望覆山。 院中可真熱鬧,春花似錦泥栖、人聲如沸簇宽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽魏割。三九已至,卻和暖如春钢颂,著一層夾襖步出監(jiān)牢的瞬間钞它,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工甸陌, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留须揣,地道東北人。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓钱豁,卻偏偏與公主長得像耻卡,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子牲尺,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容