從基因組注釋中提取轉錄因子
字符串find使用+異常值處理
今天又寫了一個小腳本,從基因組的注釋文件中篩選所有可能的轉錄因子舍扰,方法是以DNA binding的GO號及關鍵詞'Transcription factor'和'transcription factor'為篩選條件倦蚪。
昨晚其實想復雜了,主要使用一個判斷語句 str.find() != -1 就好了
import os
os.chdir('C:/Users/zm/Desktop')
Inputfile='gene_annot.txt'
TFs=[]
title=0
for line in open(Inputfile).readlines():
if title != 0:
if line.find('GO:0003677') != -1 or line.find('Transcription factor') != -1 or line.find('transcription factor') != -1:
TFs.append(line)
if line.startswith('ID'):
TFs.append(line)
title=1
昨晚寫了一點點边苹,還想著把每一行的輸入轉換成列表陵且,然后再判斷,那可真真的是很麻煩了个束,但是在想這個的時候慕购,倒是學了一個新的知識點:異常值處理
可惜了,那幾行腳本被我刪除了茬底,就是
try:
GOs.append(line[18])
except IndexError:
GOs.append('NULL')