Python模擬登陸 —— 征服驗證碼 1 豆瓣

captcha是Completely Automated Public Turing Test to Tell Computers and Humans Apart 矿瘦,全自動區(qū)分計算機和人類的圖靈測試)的簡稱伴找。

登陸失敗若干次之后,豆瓣登錄頁面才會出現(xiàn)驗證碼向族。所以為了確保py文件運行正確搀继,要先故意輸錯幾次窘面,出現(xiàn)驗證碼框之后,再運行叽躯。:)

登錄界面

使用Python3.6财边。

from urllib.request import urlretrieve
import requests
from bs4 import BeautifulSoup
from os import remove
try:
    import cookielib
except:
    import http.cookiejar as cookielib
try:
    from PIL import Image
except:
    pass

url = 'https://accounts.douban.com/login'

datas = {'source': 'index_nav',
         'remember': 'on'}

headers = {'Referer': 'https://www.douban.com/',
           'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'
           ' (KHTML, like Gecko) Chrome/60.0.3112.101 Safari/537.36',
           'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
           'Accept-Language': 'zh-CN,zh;q=0.8'}

# 嘗試使用cookie信息
session = requests.session()
session.cookies = cookielib.LWPCookieJar(filename='cookies')
try:
    session.cookies.load(ignore_discard=True)
except:
    print("Cookies未能加載")
    #cookies加載不成功,則輸入賬號密碼信息
    datas['form_email'] = input('Please input your account:')
    datas['form_password'] = input('Please input your password:')


def get_captcha():
    '''
    獲取驗證碼及其ID
    '''
    r = requests.post(url, data=datas, headers=headers)
    page = r.text
    soup = BeautifulSoup(page, "html.parser")
    # 利用bs4獲得驗證碼圖片地址
    img_src = soup.find('img', {'id': 'captcha_image'}).get('src')
    urlretrieve(img_src, 'captcha.jpg')
    try:
        im = Image.open('captcha.jpg')
        im.show()
        im.close()
    except:
        print('到本地目錄打開captcha.jpg獲取驗證碼')
    finally:
        captcha = input('please input the captcha:')
        remove('captcha.jpg')
    captcha_id = soup.find(
        'input', {'type': 'hidden', 'name': 'captcha-id'}).get('value')
    return captcha, captcha_id


def isLogin():
    '''
    通過查看用戶個人賬戶信息來判斷是否已經(jīng)登錄
    '''
    url = "https://www.douban.com/accounts/"
    login_code = session.get(url, headers=headers,
                             allow_redirects=False).status_code
    if login_code == 200:
        return True
    else:
        return False


def login():
    captcha, captcha_id = get_captcha()
    # 增加表數(shù)據(jù)
    datas['captcha-solution'] = captcha
    datas['captcha-id'] = captcha_id
    login_page = session.post(url, data=datas, headers=headers)
    page = login_page.text
    soup = BeautifulSoup(page, "html.parser")
    result = soup.findAll('div', attrs={'class': 'title'})
    #進入豆瓣登陸后頁面点骑,打印熱門內(nèi)容
    for item in result:
        print(item.find('a').get_text())
    # 保存 cookies 到文件酣难,
    # 下次可以使用 cookie 直接登錄谍夭,不需要輸入賬號和密碼
    session.cookies.save()

if __name__ == '__main__':
    if isLogin():
        print('Login successfully')
    else:
        login()
原始頁面

將標(biāo)題抓取下來了!

運行結(jié)果
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末憨募,一起剝皮案震驚了整個濱河市紧索,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌馋嗜,老刑警劉巖齐板,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件吵瞻,死亡現(xiàn)場離奇詭異葛菇,居然都是意外死亡,警方通過查閱死者的電腦和手機橡羞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進店門眯停,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人卿泽,你說我怎么就攤上這事莺债。” “怎么了签夭?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵齐邦,是天一觀的道長。 經(jīng)常有香客問我第租,道長措拇,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任慎宾,我火速辦了婚禮丐吓,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘趟据。我一直安慰自己券犁,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布汹碱。 她就那樣靜靜地躺著粘衬,像睡著了一般。 火紅的嫁衣襯著肌膚如雪咳促。 梳的紋絲不亂的頭發(fā)上稚新,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天,我揣著相機與錄音等缀,去河邊找鬼枷莉。 笑死,一個胖子當(dāng)著我的面吹牛尺迂,可吹牛的內(nèi)容都是我干的笤妙。 我是一名探鬼主播冒掌,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼蹲盘!你這毒婦竟也來了股毫?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤召衔,失蹤者是張志新(化名)和其女友劉穎铃诬,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體苍凛,經(jīng)...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡趣席,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了醇蝴。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片宣肚。...
    茶點故事閱讀 39,779評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖悠栓,靈堂內(nèi)的尸體忽然破棺而出霉涨,到底是詐尸還是另有隱情,我是刑警寧澤惭适,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布笙瑟,位于F島的核電站,受9級特大地震影響癞志,放射性物質(zhì)發(fā)生泄漏往枷。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一今阳、第九天 我趴在偏房一處隱蔽的房頂上張望师溅。 院中可真熱鬧,春花似錦盾舌、人聲如沸墓臭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽窿锉。三九已至,卻和暖如春膝舅,著一層夾襖步出監(jiān)牢的瞬間嗡载,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工仍稀, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留洼滚,地道東北人。 一個月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓技潘,卻偏偏與公主長得像遥巴,于是被迫代替她去往敵國和親千康。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,700評論 2 354

推薦閱讀更多精彩內(nèi)容