先說一下自己學(xué)習(xí)的基本目的 .?
1. 復(fù)習(xí) python
2. 理解 爬蟲架構(gòu)
---------- 開始 -------------
當(dāng)前自己機器的環(huán)境?
? a. ?mac osx , python3.5, pycharm4.5 .
? b. 還會用到各種包,都盡量的使用最新的.
------------第一個小程序段----------
#!/usr/bin/env python
# coding: utf-8
# 學(xué)習(xí)一下 BeautifulSoup v4
frombs4importBeautifulSoup
# from imp import
importurllib.request
importsys
importimportlib
importtime,datetime
importlib.reload(sys)
__author__ ='bai'
# 抓取地址 讀入頁面源文件
url1 ="http://z.cn/"
open_beg_time = time.time()
data = urllib.request.urlopen(url1).read()
open_end_time = time.time()
soup = BeautifulSoup(data,"lxml")
parse_end_time = time.time()
print(soup)
print("get page time",open_end_time - open_beg_time)
print("formate ",parse_end_time - open_end_time)
最后編輯于 :
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者