從本節(jié)開始傀履,我們開始寫代碼模塊的教程了鸥鹉。
1.為什么爬蟲要用Python
Python寫代碼速度快。Python自誕生以來(lái)余境,秉承的思想就是簡(jiǎn)單優(yōu)于復(fù)雜驻呐。所以Python寫代碼效率很高,在眾多Python強(qiáng)大的庫(kù)的加持下芳来,我們可以用短短幾十行代碼寫出來(lái)一個(gè)完整的Python爬蟲程序含末。這在其他的語(yǔ)言里,是很難做到的即舌。
Python學(xué)習(xí)成本低佣盒。Python的語(yǔ)法沒有其他語(yǔ)言那么復(fù)雜,又因?yàn)槭莿?dòng)態(tài)類型的語(yǔ)言顽聂,學(xué)習(xí)成本降低了很多肥惭,能夠更快地上手,更方便的學(xué)習(xí)紊搪。
Python的多平臺(tái)運(yùn)行也能成為一個(gè)加分項(xiàng)蜜葱。一份代碼,能夠在linux耀石、MacOS笼沥、Windows都能夠運(yùn)行,并不需要對(duì)系統(tǒng)進(jìn)行適配娶牌。
Python是一門功能強(qiáng)大的語(yǔ)言奔浅。用Python可以做到很多事情,現(xiàn)在人工智能大火诗良,用得最多的語(yǔ)言是Python汹桦;用Python也可以寫網(wǎng)站后臺(tái),而且有特別優(yōu)秀的框架(Django鉴裹、Flask舞骆、webpy...);用Python也能做桌面端GUI程序(PyQt径荔、Python自帶的tkinter)督禽;Python最強(qiáng)大的還是作為一個(gè)膠水語(yǔ)言的特性,我們可以用C語(yǔ)言寫好一個(gè)功能总处,然后打包成Python的包狈惫,這樣Python就能把一些對(duì)運(yùn)算速度要求高的步驟,交給C語(yǔ)言這樣的高性能語(yǔ)言去解決鹦马。
2. Python2.7 還是 Python3.x
毫無(wú)疑問胧谈,選擇3.x忆肾。Python2.7作為一個(gè)歷史遺留,將會(huì)在2020年失去Python團(tuán)隊(duì)的維護(hù)菱肖,所以如果不是強(qiáng)制要求用Python2.7客冈,那就來(lái)Python3.x的懷抱吧。這里沒有復(fù)雜燒腦的編碼問題稳强,對(duì)Unicode支持良好场仲。
3. 下載Python安裝包
1.首先進(jìn)入Python官網(wǎng)的下載頁(yè)面https://www.python.org/downloads/
2.進(jìn)入下載頁(yè)面之后,找到下面的Python列表退疫。選擇Python3.6的最新版3.6.5的燎窘,然后點(diǎn)擊Download進(jìn)入詳情頁(yè)面。(建議不要下載最新大版本蹄咖,比如有Python3.8.*褐健,那你下載Python3.7.*的安裝包,可以避開很多新版本可能的bug澜汤。
)
3.在下載文件選擇頁(yè)面選擇適合你系統(tǒng)類型的Python安裝包蚜迅。
選擇第一步,看表格第二列俊抵,找到符合你的系統(tǒng)的那幾行谁不,比如我的是Windows,那就是找到Windows的那幾行徽诲。
第二步刹帕,根據(jù)你的系統(tǒng)位數(shù)選擇x86-64版本還是x86版本。x86-64就是我們說(shuō)的64位的操作系統(tǒng)谎替,x86就是32位操作系統(tǒng)偷溺。如何判斷系統(tǒng)位數(shù)(桌面找到此電腦,右鍵選擇屬性)
然后在彈出來(lái)的電腦詳情頁(yè)面钱贯,有個(gè)系統(tǒng)類型挫掏。
如果實(shí)在不會(huì),那就選擇32位的就好秩命,因?yàn)?4位系統(tǒng)也兼容32位的Python尉共。
現(xiàn)在知道了我們選擇哪個(gè)系統(tǒng)哪個(gè)類型的安裝包了,可是x64和x86都有3個(gè)可以下載的包弃锐,應(yīng)該選哪個(gè)呢袄友?
第三步,選擇安裝包霹菊。
Windows x86-64 embeddable zip file 是嵌入式壓縮包剧蚣,缺少了一些Python的組件。不建議使用。
Windows x86-64 executable installer 是可執(zhí)行的安裝包券敌,帶有所有組件,我們只需要在安裝過(guò)程中對(duì)一些必要的設(shè)置勾選就好柳洋。推薦使用待诅。
Windows x86-64 web-based installer 是基于網(wǎng)絡(luò)的安裝包,它會(huì)在你啟動(dòng)之后熊镣,選擇了版本卑雁,從網(wǎng)上下載具體的Python文件。但是有一個(gè)缺點(diǎn)绪囱,它會(huì)強(qiáng)制把你的安裝目錄安裝到非常深層次的C盤里面去测蹲,會(huì)給以后尋找Python路徑帶來(lái)麻煩,不建議使用鬼吵。
所以我們就選擇 Windows x86-64 executable installer 點(diǎn)擊下載了扣甲。
4. 安裝Python
點(diǎn)開安裝包,我們開始安裝Python齿椅。
a.
首先勾選 Add Python 3.6 to PATH(這樣節(jié)約了添加 Python.exe 目錄到環(huán)境變量的步驟)
然后點(diǎn)擊Customize installtion琉挖。(不選 install Now 是因?yàn)?Python 路徑太深,不方便我們?nèi)フ业?/em>)
b.
保持默認(rèn)全勾選涣脚。Next
c.
勾選添加Python到環(huán)境變量示辈。然后選擇你要安裝Python的文件夾。在你想要安裝的盤新建一個(gè)文件夾遣蚀,比如Python36矾麻,然后在界面選中文件夾肌访。也可以選中了某個(gè)文件夾主巍,然后在后面添加\Python36,這樣會(huì)自動(dòng)給你創(chuàng)建python36文件夾则拷,并把Python3.6安裝進(jìn)去玖喘。
點(diǎn)擊Install胰耗,坐等安裝完成。
5.測(cè)試安裝是否成功
按住Windows鍵+X鍵芒涡,會(huì)彈出一個(gè)框體程序
點(diǎn)擊命令提示符柴灯,打開后,輸入 python -V
注意是大寫的V费尽,然后回車赠群。
我們的顯示結(jié)果不一樣是因?yàn)槲彝瑫r(shí)安裝了Python2.7和3.5。你看到的輸出應(yīng)該是Python 3.6.5
或者是你當(dāng)前的Python版本旱幼。如果遇到了錯(cuò)誤查描,就先繼續(xù)下一步。
我們?cè)诿钚校俅屋斎?code>pip3 -V(pip -V
也可以冬三,pip3是專指Python3.x版本的pip)匀油,V也是大寫的,并回車正常情況下輸出和下面差不多勾笆,只是Python版本或者PIP版本不一樣敌蚜。
如果都正常,那么恭喜你窝爪,安裝Python成功了弛车,并且pip的環(huán)境變量也配置好了!
6.解決遇到的問題蒲每。
在上一步如果顯示'python' 不是內(nèi)部或外部命令纷跛,也不是可運(yùn)行的程序或批處理文件。
邀杏,那就是我們需要手動(dòng)給Python設(shè)置環(huán)境變量贫奠。
'pip3' 不是內(nèi)部或外部命令,也不是可運(yùn)行的程序或批處理文件望蜡。
叮阅,那就是我們需要手動(dòng)給pip設(shè)置環(huán)境變量。
設(shè)置環(huán)境變量的步驟:右鍵此電腦 —> 屬性—>左邊的高級(jí)系統(tǒng)設(shè)置—>環(huán)境變量
選中系統(tǒng)變量里面的 Path 泣特,點(diǎn)擊編輯浩姥。
找到我們安裝Python的目錄,比如我安裝到了C盤的Python35文件夾中状您。
a. 添加Python到環(huán)境變量
提示Python不是內(nèi)部或者外部命令
的才需要這一步勒叠。我們找到了安裝Python的 文件夾,里面如果有一個(gè) python.exe膏孟。那就找對(duì)了文件夾了眯分。
我們點(diǎn)擊上面的
,就變成了上個(gè)圖我們所看到的的情況了柒桑。然后我們復(fù)制這個(gè)路徑弊决。
回到剛才的環(huán)境變量里面,點(diǎn)擊新增魁淳,然后把剛剛復(fù)制的路徑粘貼進(jìn)去飘诗。
點(diǎn)擊一下空白處,就保存了界逛。再重新Windows鍵+X鍵打開命令行昆稿,Python -V
命令就能正常輸出了。
b.添加pip到環(huán)境變量息拜。
我們找到Python安裝目錄下的Scripts文件夾并進(jìn)入溉潭,同樣也點(diǎn)擊頂部的路徑并復(fù)制净响,到環(huán)境變量界面,再次點(diǎn)擊新建喳瓣,然后粘貼馋贤,點(diǎn)擊空白處。再重新用重新Windows鍵+X鍵打開命令行畏陕,pip3 -V
就能輸出了配乓。
如果按照以上步驟做了,還是提示不是內(nèi)部或外部命令的蹭秋。請(qǐng)注意你是否關(guān)閉了命令行扰付,并在添加了環(huán)境變量之后重啟再打開的命令行堤撵。在新增環(huán)境變量之前的打開的命令行仁讨,是不會(huì)起效果的。
大功告成实昨!
傳送門:
下一章:
爬蟲入門教程⑥—安裝爬蟲常用工具包
所有的章節(jié):
- 爬蟲入門教程①— 爬蟲簡(jiǎn)介
- 爬蟲入門教程②— 必備知識(shí)基礎(chǔ)(一)反爬蟲簡(jiǎn)介
- 爬蟲入門教程③— 必備知識(shí)基礎(chǔ)(二)HTTP請(qǐng)求簡(jiǎn)介
- 爬蟲入門教程④— 必備知識(shí)基礎(chǔ)(三)網(wǎng)頁(yè)的構(gòu)成
- [爬蟲入門教程⑤— 安裝Python]
- 爬蟲入門教程⑥— 安裝爬蟲常用工具包
- 爬蟲入門教程⑦— jupyter與requests的初步使用
- 爬蟲入門教程⑧— BeautifulSoup解析豆瓣即將上映的電影信息
- 爬蟲入門教程⑨— 用html和csv文件保存爬取到的數(shù)據(jù)
- 爬蟲入門教程⑩— 用漂亮的圖表展示爬取到的數(shù)據(jù)