首先要感謝下@向右奔跑,我是看了他在簡(jiǎn)書上寫的學(xué)習(xí)文章后,我覺得我也該把自己的學(xué)習(xí)歷程記錄下來,方便自己忘記要點(diǎn)時(shí)能回看蔗牡,也方便其他想接觸python爬蟲的同學(xué)。
從基礎(chǔ)開始嗅剖,肯定是學(xué)習(xí)怎么安裝python這個(gè)軟件辩越,目前python分為2.X和3.X的版本,兩者在部分庫(kù)和編程方法上有些區(qū)別信粮,其它大致相同黔攒。那該怎么選擇呢?個(gè)人推薦直接安裝anaconda强缘,它提供了python兩種版本的安裝方法督惰,怎樣>_<是不是已經(jīng)感覺到很貼心,繼續(xù)往下看旅掂。
爬蟲過程需要安裝很多庫(kù)赏胚,如果只是安裝了python的話,就需要自己動(dòng)手安裝各種讓人隨時(shí)想撞墻的庫(kù)商虐,因?yàn)楹苋菀装惭b失敗觉阅。而anaconda把它們?nèi)善饋硌掳蹋簿褪钦f你安裝的同時(shí)它把所需的庫(kù)都給你裝上了。如果遇到?jīng)]有的庫(kù)留拾,自己打開anaconda prompt,也可以cmd鲫尊。輸入“pip install +安裝的庫(kù)的名字”(PS:pip這個(gè)東西如果你只安裝python的話痴柔,你是需要自己額外安裝的)
寫程序的話,我是用到里面的spyder疫向。度娘過咳蔚,界面和maltab類似(反正我沒用過maltab,我不知道~_~)
不過用了幾天之后搔驼,發(fā)現(xiàn)一個(gè)問題就是你輸入庫(kù)名字的時(shí)候谈火,系統(tǒng)在字體下面不會(huì)提示你即將輸入的是什么庫(kù),十分不方便像我這樣沒基礎(chǔ)的新手舌涨,萬一輸錯(cuò)了還得回頭調(diào)試糯耍。所以,這時(shí)候我們需要另一個(gè)軟件Pycharm囊嘉,安裝然后匹配anaconda自帶的python.exe后就能用了温技。如下圖我打算輸入requests,系統(tǒng)自動(dòng)出現(xiàn)提示了扭粱。其它功能要自己摸索下舵鳞,我目前也不是很熟悉。為什么不直接安裝pycharm呢琢蛤?因?yàn)閜ycharm只是一個(gè)比IDE更強(qiáng)大的操作界面蜓堕,庫(kù)什么的要自己附加進(jìn)去的,而導(dǎo)入anaconda的python時(shí)系統(tǒng)就自動(dòng)把相應(yīng)的庫(kù)都導(dǎo)進(jìn)去了博其,所以要先安裝anaconda套才。我看過的大部分爬蟲都是用pycharm寫的,所以以后就用這個(gè)了慕淡。
這只是簡(jiǎn)單介紹下我這幾天學(xué)習(xí)過程中霜旧,操作軟件之間的更換問題,用anaconda下載所需庫(kù)+pycharm寫代碼儡率,我個(gè)人覺得十分強(qiáng)大而且省時(shí)省力挂据。