1.情景
爬蟲離不了json的解析稼病,但是目前很多網(wǎng)站中都使用json進(jìn)行數(shù)據(jù)傳輸扒寄,動(dòng)態(tài)展現(xiàn)瞧甩,所以json的解析對于爬蟲是很重要的谓形。
2.什么是JSON灶伊?
JSON(JavaScript Object Notation)?是一種輕量級的數(shù)據(jù)交換格式,它是JavaScript的子集寒跳,易于人閱讀和編寫谁帕。前端和后端進(jìn)行數(shù)據(jù)交互,其實(shí)就是JS和Python進(jìn)行數(shù)據(jù)交互冯袍。
3.使用方法:
在python中使用json包解析json匈挖,使用時(shí)先引入json包:import json
常用的三個(gè)函數(shù)load(),loads(),dumps()
(1)json.loads():傳入一個(gè)json字符串,返回一個(gè)字符串解析出來的list或dict.
(2)json.load():它和json.loads()很像康愤,但是絕對不一樣儡循,這個(gè)函數(shù)的作用是從文件中讀取json并解析成dict或list.
(3)json.dumps():把一個(gè)dict或list轉(zhuǎn)換成字符串,相當(dāng)于json.loads()的逆向過程
(4)json.dump():與文件操作結(jié)合的征冷,實(shí)際中用的不多.
4.案例
下面是通過爬蟲獲取到的json格式的結(jié)果service_point:
json格式的結(jié)果:service_point
輸入代碼:
service_list = json.loads(service_point)
得到service_list(字典格式):
字典格式的結(jié)果:service_list