這個爬蟲是今年暑假時學完小甲魚的Python視頻后寫的鄙信。關于Python3的爬蟲教程不多著拭,下面只是使用了一些簡單的用法。
程序使用了xlwt
包霜浴,用于創(chuàng)建Excel文檔并寫入數(shù)據(jù)够庙,安裝很簡單:pip install xlwt
關于ACM近期比賽恭应,下面的鏈接種給出了一個json格式的源數(shù)據(jù)。我們可以用Python的urllib下載下來首启,然后解析這個json即可暮屡。
http://contests.acmicpc.info/contests.json
import xlwt, json, urllib.request
def getDate():
page = urllib.request.urlopen("http://contests.acmicpc.info/contests.json")
return page.read().decode()
def getJson(s):
j = json.loads(s)
return j
def writeExcel(header, v):
wb = xlwt.Workbook()
ws = wb.add_sheet('Sheet1')
for c in range(len(header)):
ws.write(0, c, header[c])
for r in range(len(v)):
ws.write(r+1, c, v[r][header[c]])
wb.save('Recent contests.xls')
header = ['oj', 'name', 'link', 'start_time', 'week', 'access']
writeExcel(header, getJson(getDate()))