@(Python)[web scrapy|python]
抓取空氣質(zhì)量信息@www.pm25.in
僅做測試使用辩稽。
import requests # 引入requests獲取網(wǎng)站內(nèi)容
import re # 引入re正則表達式模塊
url = 'http://www.pm25.in/api/querys/all_cities.json?token=5j1znBVAsnSf5xQyNQyq' # token是該網(wǎng)站的公用API啦粹。該地址獲取的是所有城市的空氣質(zhì)量信息免糕。
r = requests.get(url) # 獲得方式為GET
print(r.text)
inputTxt = re.compile((r'{.*?}') # 分割r.text中每個城市的信息
cityTxt = re.compile(r'"area":"(.*?)"') # 設(shè)置城市字段的提取規(guī)則
pm25Value = re.compile(r'"pm2_5_24h":(\d+)') # 設(shè)置24小時內(nèi)的pm2.5均值字段的提取規(guī)則
content = {}
for i in re.findall(inputTxt, r.text):
content[re.findall(cityTxt,i)[0]]=re.findall(pm25Value,i)[0] # 創(chuàng)建字典详恼,形式為 city : pm2.5
@ All rights reserved.