自學(xué)了好長時間的爬蟲唱凯,今天終于自己親自動手實打?qū)嵉那昧艘徊ùa,寫了一個在爬蟲案例中都爛大街的案例爬取豆瓣電影top250慕爬。因為平時只是動手練習(xí)一些技術(shù)性的東西比如解析庫的語法膀斋,幾乎沒有寫過完整的爬蟲代碼,在學(xué)習(xí)大神們發(fā)的案例時只是把代碼讀一遍获黔,哪里不懂才會去動手寫一下蚀苛,所以導(dǎo)致了一個問題在看案例時都懂而到動手是確出現(xiàn)了不少的麻煩,為此決定痛改前非踏踏實實一步一個腳印的做好每一步玷氏,爭取做一個攻城獅大佬堵未。
總結(jié)一下出現(xiàn)的問題:1.花的時間太長;因為動手經(jīng)驗不足盏触,在進(jìn)行每一個步驟時都會回憶一下別人是怎么做的時間自然而然就耗過去了渗蟹。2.選擇器還是不太熟悉块饺;剛開始我是打算用pyquery解析網(wǎng)頁的,但是寫出來的選擇器一直報錯說是語法錯誤雌芽,我也翻出大佬們的
案例照著寫依舊報錯授艰,索性就換成了用xpath來解析網(wǎng)頁。3.對python的基礎(chǔ)語法掌握的還是不太牢固世落,會在這上面上犯一些小錯誤淮腾。4.太欠缺動手經(jīng)驗,從而帶來了一些根本沒有必要產(chǎn)生的麻煩屉佳。
所以說不管任何事只有你去動手做了才能發(fā)現(xiàn)問題所在谷朝,才能不斷提升自己。
最后也曬一下自己寫的成果忘古。