自己一直對爬蟲挺感興趣悔雹,但對其理解不過是可以更高效率的搜集信息复哆。聽完第一課,知道爬蟲可以從獲取信息腌零,再到整理成一份完整的結果結果梯找,如表格。感覺真的是異常強大益涧。 上半年的數(shù)據(jù)分析課程锈锤,我自己的作業(yè)提交率,估計只有30%闲询,自己下半年希望能每堂課都提交作業(yè)了久免。畢竟完成比完美重要
我想用爬蟲爬去什么數(shù)據(jù)類別?
成都數(shù)據(jù)行業(yè)的招聘信息扭弧。
- 因為自己明年可能回成都生活阎姥,想把自己未來的職業(yè)方向轉向大數(shù)據(jù)行業(yè),故而想看看成都這方面就業(yè)的可能性鸽捻。
對應的數(shù)據(jù)源網(wǎng)站
- 獵聘網(wǎng)
- boss 直聘
爬取數(shù)據(jù)的url
- 獵聘網(wǎng) https://c.liepin.com/?time=1498901196181 (需要登錄)
- Linkedin https://www.linkedin.com/jobs/search/?f_GC=cn.4-2&keywords=%E5%A4%A7%E6%95%B0%E6%8D%AE&location=%E4%B8%AD%E5%9B%BD%20%E5%9B%9B%E5%B7%9D%20%E6%88%90%E9%83%BD&locationId=cn%3A8963 (需要登錄才行)
- boss 直聘 https://www.zhipin.com/?sid=
數(shù)據(jù)篩選規(guī)則
這個問題我不太理解丁寄,根據(jù)自己的想法氨淌,應該是需要搜集哪些數(shù)據(jù)
爬去的數(shù)據(jù)中應包含以下信息:
- 公司名稱
- 職位
- 聯(lián)系方式
- 職位描述
- 薪資
- 地點