IP屬地:甘肅
憑什么你可以靠辱罵他人茍活于世织咧? 簡(jiǎn)書就這樣了凛虽?
可以看出只有最后的數(shù)字在變化,所以進(jìn)行url的構(gòu)造圣猎,然后開始爬取
# 觀察該頁(yè)面的加載方式 分析產(chǎn)生的url與前一頁(yè)存在id的關(guān)系 獲取的數(shù)據(jù)
一共創(chuàng)建了三個(gè)表 yidong dianxin liantong逝钥。用來分別保存所爬取的數(shù)據(jù)
推薦看MongoDB的官方文檔,有興趣的小伙伴們可以一起學(xué)習(xí)喲
存在的問題: 1糕再、通過推薦粉絲進(jìn)行爬取無法全部獲得谤职。 2、爬取速度過慢亿鲜,代碼需要優(yōu)化 3允蜈、寫入用戶信息時(shí),粉絲信息寫入了兩遍蒿柳,這個(gè)可以忽略......