前置知識(shí)和要求:
- Python基本語(yǔ)法,程序邏輯基礎(chǔ)完成
- 了解HTML
- 正則表達(dá)式
推薦視頻:Python開(kāi)發(fā)簡(jiǎn)單爬蟲(chóng)
視頻介紹了完整的爬蟲(chóng)流程:URL管理蛤售,網(wǎng)頁(yè)下載,頁(yè)面解析碘赖。
正則表達(dá)式30分鐘入門(mén)教程 (這篇內(nèi)容比較多升筏,全面)
010 - 使用BeautifulSoup和XPath抓取結(jié)構(gòu)化數(shù)據(jù)
正則表達(dá)式在線測(cè)試工具:http://tool.oschina.net/regex/
開(kāi)始你的第一個(gè)爬蟲(chóng)程序~