因為工作的原因一直在做爬蟲的工作霹购,最近就想寫一個關(guān)于爬蟲的系列,一邊好好回顧一下自己所學(xué)習(xí)到的知識突梦,整理一下自己的知識體系敏弃,一邊也是想分(xuan)享(yao)一下自己多年的經(jīng)驗和心得盯孙,方便一下初學(xué)者們鲁森。
初學(xué)爬蟲,使用什么語言是第一個選擇振惰。因為我是使用python的歌溉,這里就以python語言作為這個系列的基礎(chǔ)語言。
(一)安裝python
先打開終端,輸入 python痛垛,看看電腦是否已經(jīng)安裝python草慧,通常mac已經(jīng)安裝了,但是是2.7版本匙头。
windows的話就應(yīng)該沒有漫谷,windows用戶可以去官網(wǎng)下載python。
python現(xiàn)在有兩個版本蹂析,2.x版本和3.x版本舔示,兩個版本都能使用,但語法和工具庫上是有區(qū)別的识窿,據(jù)說2.x版本要在2020年停止維護,所以最好使用3.x版本脑融,直接使用最新版的就好了(我使用的時候是3.7版本)喻频。
下載的時候最好把pip 這個工具下載了。
mac用戶如果想安裝python3:
1.安裝xcode(去app store上下載)肘迎, 然后安裝Xcode command line tool,在終端輸入xcode-select --install
2.安裝homedrew
ruby-e"$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
在終端驗證一下是否安裝成功brew doctor
接著就通過 brew install python3
安裝python3
最后通過homebrew
(二)pip的使用
打開終端甥温,輸入python -m pip --version
,看看電腦是否已經(jīng)安裝了pip妓布,如果沒有姻蚓,windows用戶請去Python官網(wǎng)上下載Windows版本pip安裝包,蘋果用戶就下載mac版本(注意要分清楚你需要的是2.x版本還是3.x版本匣沼,pip也分2和3哦)狰挡。通常蘋果用戶是會用然后解壓,進入解壓后的文件夾至可執(zhí)行目錄释涛,如下圖所示:
在地址欄那里回車加叁,輸入cmd,進入控制臺然后輸入python setup.py install
就可以安裝了唇撬。
pip是python專用的安裝工具它匕,許多第三方庫都是通過pip下載的,但要注意窖认,2和3有些庫的名字是有區(qū)別的豫柬,想要下載某個庫時需要搜清楚要下載的是2還是3,有些庫在3中是不存在或者和2的名字不一樣的扑浸。
語法:
pip install xxx
安裝庫使用
pip install xxx==x.x.x(版本號)
安裝某個庫的某個版本時烧给,在后面加上版本后就好了
pip install -U xxx
更新庫
pip uninstall xxx
刪除庫
easy_install是python的另一種安裝工具,有時候使用pip安裝不成功時喝噪,使用easy_install 就有可能安裝成功
easy_install xxx
安裝包
easy_install -U xxx
更新包
通過easy_install 安裝的包要卸載非常困難创夜,不建議卸載。
(三)python3簡單語法
#!/usr/bin/python
# -*- coding: <encoding name> -*-
#python3默認(rèn)字符是utf-8仙逻,所以可以不加這兩句
import xxx #引入第三方庫
from xxx import xxx #從第三方庫映入某個類
input(5) #輸入數(shù)字5
print(5) #print 是python的輸出符號驰吓,在python2中可以不加(),但python3中加入了必須加
#for 循環(huán)
for i in range(1,5):
print(i)
'''
特殊的 for 循環(huán)
i是代表位置涧尿,data是list中這個位置的數(shù)據(jù)
這是python中的特殊語法,可以同時獲得位置和數(shù)據(jù)
'''
for i檬贰,data in enumerate(a_list):
print(i)
print(data)
if a > b:
print('ok')
'''
關(guān)于if判斷語句的用法姑廉,python是使用縮進來判斷的,和java是不一樣的翁涤,沒有花括號桥言,多了個“:”。
對了葵礼,夾雜點私貨号阿,我是個空格黨,在sublime text3 里早早設(shè)定了tab鍵=4個空格鸳粉。
至于其他的扔涧,好像沒什么要說了,python是門以簡單為哲學(xué)的語言届谈,很多麻煩的概念都沒有
四 編輯器(IDE)
有哪些比較常用的ide呢枯夜?
pycharm,sublime text艰山,vs code湖雹,vim等等。
有時候在需要大量使用數(shù)據(jù)分析的工具的時候曙搬,使用ipython也是很不錯的(一個庫摔吏?可以在終端使用的編輯器)
我個人比較習(xí)慣使用sublime text或者是vi,自己舒服著用就好纵装。