比較兩個(gè)基因名文件的差異
有時(shí)候需要比較兩個(gè)只有基因名的文件時(shí)虹菲,可以用將每個(gè)文件讀入弦讽,并用集合(set)的算法喇肋,來(lái)比較兩個(gè)文件
如:
file1.txt
gene1
gene2
gene3
gene4
gene5
gene6
file2.txt
gene1
gene2
gene4
gene7
gene8
gene10
具體python代碼如下:
import sys
#用sys.argv[1]和[2]來(lái)接收兩個(gè)文件
file1 = open(sys.argv[1], 'r').readlines()
file2 = open(sys.argv[2], 'r').readlines()
#接收的文件轉(zhuǎn)換成集合鸣戴,然后用 ^ 來(lái)計(jì)算兩個(gè)集合的對(duì)稱(chēng)差集
differece = set(file1) ^ set(file2)
outtxt = open('output_diff_file.txt', 'w')
for line in differece:
outtxt.write(line)
outtxt.close()
接下來(lái)在命令行中輸入python腳本加上兩個(gè)txt文件就能輸出名為'output_diff_file.txt'的文件了胯甩,這個(gè)文件就是file1和file2中有差異的基因名了昧廷。