豆瓣有那么一點(diǎn)惡心,爬蟲想登上去不是很容易,登陸豆瓣权烧,應(yīng)該是看到的這個(gè)界面
但是這個(gè)頁面是不能直接處理登陸的慧瘤。陈哑。噢塑娇,對(duì)了景用,我是用的selenium登陸豆瓣的打肝,也可以用cookies娩缰,而且好像cookies好像還更簡單一點(diǎn)蓬痒。。我是開始的時(shí)候被坑了漆羔,發(fā)現(xiàn)源碼里面沒有文章的東西(其實(shí)是我看漏了)梧奢,以為是js動(dòng)態(tài)加載的,就想著用selenium處理演痒。亲轨。。繞了一大圈鸟顺。惦蚊。咳咳讯嫂,還是說正事蹦锋。。欧芽。
然后我就換到這個(gè)頁面登陸
https://www.douban.com/accounts/login?source=main
這個(gè)就好處理多了
直接
username = drive.find_element_by_name('form_email')
username.clear()
username.send_keys('xxxxx')
password = drive.find_element_by_name('form_password')
password.clear()
password.send_keys('xxxxxx')
然后驗(yàn)證碼的處理我用的手動(dòng)輸入莉掂。。不想弄麻煩了千扔。憎妙。
a = input("輸入驗(yàn)證碼:")
yanzheng = drive.find_element_by_name('captcha-solution')
yanzheng.clear()
yanzheng.send_keys(a)
yanzheng.send_keys(Keys.RETURN)
登陸上以后,你就可以直接打開其他的豆瓣頁面了曲楚。