昨天kegg pathway解析不是說后面補上map號和ko號的對應關系嗎诀紊,今天補上事期。
昨天的代碼一個class,里面包含幾個函數(shù)萨脑,要對應map號和ko號,只需要添加一個函數(shù)采幌,判斷map號是否有對應的ko號贴届,有就返回ko號靠粪,沒有就返回空。
添加的函數(shù)如下:
def map2ko(self, mapid):
ko = ""
url = 'https://www.genome.jp/entry/pathway+'+ mapid
response = requests.get(url, headers = self.headers)
html = response.text
soup = BeautifulSoup(html, "lxml")
table = soup.find(class_="fr3").find_all("a")
for i in table:
i = i.get_text()
if 'ko' in i:
ko = i
return ko
這就是函數(shù)化的好處毫蚓,添加功能就添加一個函數(shù)占键。為何要給ko先賦值一個“”呢?這里就不說了元潘。想必使用就無需在這里貼出來了畔乙。強烈建議添加提示信息,因為要爬取多個map號判斷是否對應ko號翩概,這個時間可能會比較長牲距,有提示信息總是要好一點。
結果如下: