selenium+python破解滑動驗證碼

破解滑動驗證碼動態(tài)圖片.gif

最近在參與公司大數(shù)據(jù)項目的測試,其中部分?jǐn)?shù)據(jù)來源于網(wǎng)絡(luò)爬蟲,想用selenium輔助測試吃环,無奈有驗證碼(滑動驗證碼),于是就想著怎么破解洋幻,參考了網(wǎng)上的一些破解的方法郁轻,發(fā)現(xiàn)有一定的失敗的概率,自己加以改進(jìn)后鞋屈,最終破解成功達(dá)到了100%范咨,程序執(zhí)行破解的過程見如上動圖所示:


破解的原理大概是這樣的:使用selenium拖動滑塊,識別圖片中的缺口厂庇,然后將滑塊拖動至缺口處渠啊,完成拼圖。整個過程看似簡單权旷,但程序處理起來并不簡單:1替蛉、怎么判斷缺口的位置,這個要對比圖片背景的色差拄氯,2躲查、怎么模擬人類拖動滑塊的操作,勻速滑動或者一次性滑動到位都會被判定為程序行為而非人工操作译柏,從而被禁止镣煮,這個可以通過隨機(jī)函數(shù)進(jìn)行隨機(jī)滑動,3鄙麦、操作的時候可能會失敗典唇,這個可以遞歸調(diào)用滑動操作,失敗后重新刷新驗證碼并再一次進(jìn)行滑動操作胯府,直至成功介衔。


找到了兩種破解方法,方法一單次破解的成功率在20%左右骂因,通常需要遞歸調(diào)用4到5次就能破解成功炎咖,方法二單次破解成功率在90%左右,通常只用調(diào)用1次就能破解成功寒波,最多不超過2次乘盼。

以下是方法一和方法二的源代碼:

方法一


from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.action_chains import ActionChains
import PIL.Image as image
import time,re, random
import requests
try:
    from StringIO import StringIO
except ImportError:
    from io import StringIO

#爬蟲模擬的瀏覽器頭部信息
agent = 'Mozilla/5.0 (Windows NT 5.1; rv:33.0) Gecko/20100101 Firefox/33.0'
headers = {
        'User-Agent': agent
        }

# 根據(jù)位置對圖片進(jìn)行合并還原
# filename:圖片
# location_list:圖片位置
#內(nèi)部兩個圖片處理函數(shù)的介紹
#crop函數(shù)帶的參數(shù)為(起始點的橫坐標(biāo),起始點的縱坐標(biāo)俄烁,寬度绸栅,高度)
#paste函數(shù)的參數(shù)為(需要修改的圖片,粘貼的起始點的橫坐標(biāo)猴娩,粘貼的起始點的縱坐標(biāo))
def get_merge_image(filename,location_list):
    #打開圖片文件
    im = image.open(filename)
    #創(chuàng)建新的圖片,大小為260*116
    new_im = image.new('RGB', (260,116))
    im_list_upper=[]
    im_list_down=[]
    # 拷貝圖片
    for location in location_list:
        #上面的圖片
        if location['y']==-58:
            im_list_upper.append(im.crop((abs(location['x']),58,abs(location['x'])+10,166)))
        #下面的圖片
        if location['y']==0:
            im_list_down.append(im.crop((abs(location['x']),0,abs(location['x'])+10,58)))
    new_im = image.new('RGB', (260,116))
    x_offset = 0
    #黏貼圖片
    for im in im_list_upper:
        new_im.paste(im, (x_offset,0))
        x_offset += im.size[0]
    x_offset = 0
    for im in im_list_down:
        new_im.paste(im, (x_offset,58))
        x_offset += im.size[0]
    return new_im

#下載并還原圖片
# driver:webdriver
# div:圖片的div
def get_image(driver,div):
    #找到圖片所在的div
    background_images=driver.find_elements_by_xpath(div)
    location_list=[]
    imageurl=''
    #圖片是被CSS按照位移的方式打亂的,我們需要找出這些位移,為后續(xù)還原做好準(zhǔn)備
    for background_image in background_images:
        location={}
        #在html里面解析出小圖片的url地址,還有長高的數(shù)值
        location['x']=int(re.findall("background-image: url\(\"(.*)\"\); background-position: (.*)px (.*)px;",background_image.get_attribute('style'))[0][1])
        location['y']=int(re.findall("background-image: url\(\"(.*)\"\); background-position: (.*)px (.*)px;",background_image.get_attribute('style'))[0][2])
        imageurl=re.findall("background-image: url\(\"(.*)\"\); background-position: (.*)px (.*)px;",background_image.get_attribute('style'))[0][0]
        location_list.append(location)
    #替換圖片的后綴,獲得圖片的URL
    imageurl=imageurl.replace("webp","jpg")
    #獲得圖片的名字
    # imageName = imageurl.split('/')[-1]
    imageName = '77777777'
    #獲得圖片
    session = requests.session()
    r = session.get(imageurl, headers = headers, verify = False)
    #下載圖片
    with open(imageName, 'wb') as f:
        f.write(r.content)
        f.close()
    #重新合并還原圖片
    image=get_merge_image(imageName, location_list)
    return image

#對比RGB值
def is_similar(image1,image2,x,y):
    pass
    #獲取指定位置的RGB值
    pixel1=image1.getpixel((x,y))
    pixel2=image2.getpixel((x,y))
    for i in range(0,3):
        # 如果相差超過50則就認(rèn)為找到了缺口的位置
        if abs(pixel1[i]-pixel2[i])>=50:
            return False
    return True

#計算缺口的位置
def get_diff_location(image1,image2):
    i=0
    # 兩張原始圖的大小都是相同的260*116
    # 那就通過兩個for循環(huán)依次對比每個像素點的RGB值
    # 如果相差超過50則就認(rèn)為找到了缺口的位置
    for i in range(0,260):
        for j in range(0,116):
            if is_similar(image1,image2,i,j)==False:
                return  i

#根據(jù)缺口的位置模擬x軸移動的軌跡
def get_track(length):
    pass
    list=[]
    #間隔通過隨機(jī)范圍函數(shù)來獲得,每次移動一步或者兩步
    x=random.randint(1,3)
    #生成軌跡并保存到list內(nèi)
    while length-x>=5:
        list.append(x)
        length=length-x
        x=random.randint(1,3)
    #最后五步都是一步步移動
    for i in range(length):
        list.append(1)
    return list

def slide(driver):
     # 等待頁面的上元素刷新出來
     WebDriverWait(driver, 30).until(
         lambda the_driver: the_driver.find_element_by_xpath('//a[@class="gt_refresh_button"]').is_displayed())
     element = driver.find_element_by_xpath('//a[@class="gt_refresh_button"]')
     element.click()
     time.sleep(1)
     WebDriverWait(driver, 30).until(
        lambda the_driver: the_driver.find_element_by_xpath("http://div[@class='gt_slider_knob gt_show']").is_displayed())
     # driver.find_element_by_css_selector("/html/body/div[4]/div[2]/div[2]/div[2]/div[2]']").click()
     WebDriverWait(driver, 30).until(
        lambda the_driver: the_driver.find_element_by_xpath("http://div[@class='gt_cut_bg gt_show']").is_displayed())
     WebDriverWait(driver, 30).until(
        lambda the_driver: the_driver.find_element_by_xpath("http://div[@class='gt_cut_fullbg gt_show']").is_displayed())
     element = driver.find_element_by_xpath('//a[@class="gt_refresh_button"]')
     element.click()
     time.sleep(1)
     # 下載圖片
     image1 = get_image(driver, "http://div[@class='gt_cut_bg gt_show']/div")
     image2 = get_image(driver, "http://div[@class='gt_cut_fullbg gt_show']/div")
     # 計算缺口位置
     loc=get_diff_location(image1, image2)
     #生成x的移動軌跡點
     track_list=get_track(loc)
     #找到滑動的圓球
     element=driver.find_element_by_xpath("http://div[@class='gt_slider_knob gt_show']")
     location=element.location
     #獲得滑動圓球的高度
     y=location['y']
     #鼠標(biāo)點擊元素并按住不放
     print ("第一步,點擊元素")
     ActionChains(driver).click_and_hold(on_element=element).perform()
     time.sleep(0.15)
     print ("第二步,拖動元素")
     track_string = ""
     for track in track_list:
        #不能移動太快,否則會被認(rèn)為是程序執(zhí)行
        track_string = track_string + "{%d,%d}," % (track, y - 445)
        #xoffset=track+22:這里的移動位置的值是相對于滑動圓球左上角的相對值卷中,而軌跡變量里的是圓球的中心點矛双,所以要加上圓球長度的一半。
        #yoffset=y-445:這里也是一樣的蟆豫。不過要注意的是不同的瀏覽器渲染出來的結(jié)果是不一樣的议忽,要保證最終的計算后的值是22,也就是圓球高度的一半
        ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=track+22, yoffset=y-445).perform()
        #間隔時間也通過隨機(jī)函數(shù)來獲得,間隔不能太快,否則會被認(rèn)為是程序執(zhí)行
        time.sleep(random.randint(10,50)/100)
     print (track_string)
     #xoffset=21十减,本質(zhì)就是向后退一格栈幸。這里退了5格是因為圓球的位置和滑動條的左邊緣有5格的距離
     ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()
     time.sleep(0.1)
     ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()
     time.sleep(0.1)
     ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()
     time.sleep(0.1)
     ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()
     time.sleep(0.1)
     ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()
     print ("第三步,釋放鼠標(biāo)")
     #釋放鼠標(biāo)
     ActionChains(driver).release(on_element=element).perform()
     time.sleep(3)
     s = driver.find_elements_by_xpath('//*[@id="wrap1"]/div[3]/div/div/p')
     if len(s) == 0:
         print("滑動解鎖失敗")
         slide(driver)
     else:
         print("滑動解鎖成功")

#滑動驗證碼破解程序
def main():
    #打開火狐瀏覽器
    driver=webdriver.Chrome("D:\Google\Chrome\Application\chromedriver.exe")
    #用火狐瀏覽器打開網(wǎng)頁
    driver.get("http://www.sgs.gov.cn/notice/")
    driver.find_element_by_id("keyword").send_keys('中國長城工業(yè)上海有限公司')
    driver.find_element_by_id("buttonSearch").click()



    slide(driver)



    #點擊驗證
    # submit = driver.find_element_by_xpath("http://div[@class='gt_ajax_tip success']")
    # print(submit.location)
    # time.sleep(5)
    #關(guān)閉瀏覽器,為了演示方便,暫時注釋掉.
    #driver.quit()

#主函數(shù)入口
if __name__ == '__main__':
    pass
    main()

方法二


# -*- coding: utf-8 -*-
import random
import time, re
from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.action_chains import ActionChains
from PIL import Image
import requests
from io import BytesIO


class Vincent(object):
    def __init__(self):
        chrome_option = webdriver.ChromeOptions()
        # chrome_option.set_headless()

        self.driver = webdriver.Chrome(executable_path=r"D:\Google\Chrome\Application\chromedriver.exe", chrome_options=chrome_option)
        # self.driver =webdriver.Chrome("D:\Google\Chrome\Application\chromedriver.exe")
        self.driver.set_window_size(1440, 900)

    def visit_index(self):
        # self.driver.get("https://www.Vincent.com/")
        self.driver.get("http://www.sgs.gov.cn/notice/")

        self.driver.find_element_by_id("keyword").send_keys('中國長城工業(yè)上海有限公司')
        WebDriverWait(self.driver, 10, 0.5).until(EC.element_to_be_clickable((By.ID, 'buttonSearch')))
        reg_element = self.driver.find_element_by_id("buttonSearch")
        reg_element.click()

        WebDriverWait(self.driver, 10, 0.5).until(
            EC.element_to_be_clickable((By.XPATH, '//div[@class="gt_slider_knob gt_show"]')))

        # 進(jìn)入模擬拖動流程
        self.analog_drag()

    def analog_drag(self):
        # 鼠標(biāo)移動到拖動按鈕帮辟,顯示出拖動圖片
        element = self.driver.find_element_by_xpath('//div[@class="gt_slider_knob gt_show"]')
        ActionChains(self.driver).move_to_element(element).perform()
        time.sleep(3)

        # 刷新一下極驗圖片
        element = self.driver.find_element_by_xpath('//a[@class="gt_refresh_button"]')
        element.click()
        time.sleep(1)

        # 獲取圖片地址和位置坐標(biāo)列表
        cut_image_url, cut_location = self.get_image_url('//div[@class="gt_cut_bg_slice"]')
        full_image_url, full_location = self.get_image_url('//div[@class="gt_cut_fullbg_slice"]')

        # 根據(jù)坐標(biāo)拼接圖片
        cut_image = self.mosaic_image(cut_image_url, cut_location)
        full_image = self.mosaic_image(full_image_url, full_location)

        # 保存圖片方便查看
        cut_image.save("cut.jpg")
        full_image.save("full.jpg")

        # 根據(jù)兩個圖片計算距離
        distance = self.get_offset_distance(cut_image, full_image)

        # 開始移動
        self.start_move(distance)

        # 如果出現(xiàn)error
        try:
            WebDriverWait(self.driver, 5, 0.5).until(
                EC.element_to_be_clickable((By.XPATH, '//div[@class="gt_ajax_tip gt_error"]')))
            print("驗證失敗")
            return
        except TimeoutException as e:
            pass

        # 判斷是否驗證成功
        s = self.driver.find_elements_by_xpath('//*[@id="wrap1"]/div[3]/div/div/p')
        if len(s) == 0:
            print("滑動解鎖失敗,繼續(xù)嘗試")
            self.analog_drag()
        else:
            print("滑動解鎖成功")
            time.sleep(1)
            ss=self.driver.find_element_by_xpath('//*[@id="wrap1"]/div[3]/div/div/div[2]').get_attribute("onclick")
            print(ss)
            ss=self.driver.find_element_by_xpath('//*[@id="wrap1"]/div[3]/div/div/div[2]').click()



    # 獲取圖片和位置列表
    def get_image_url(self, xpath):
        link = re.compile('background-image: url\("(.*?)"\); background-position: (.*?)px (.*?)px;')
        elements = self.driver.find_elements_by_xpath(xpath)
        image_url = None
        location = list()
        for element in elements:
            style = element.get_attribute("style")
            groups = link.search(style)
            url = groups[1]
            x_pos = groups[2]
            y_pos = groups[3]
            location.append((int(x_pos), int(y_pos)))
            image_url = url
        return image_url, location

    # 拼接圖片
    def mosaic_image(self, image_url, location):
        resq = requests.get(image_url)
        file = BytesIO(resq.content)
        img = Image.open(file)
        image_upper_lst = []
        image_down_lst = []
        for pos in location:
            if pos[1] == 0:
                # y值==0的圖片屬于上半部分速址,高度58
                image_upper_lst.append(img.crop((abs(pos[0]), 0, abs(pos[0]) + 10, 58)))
            else:
                # y值==58的圖片屬于下半部分
                image_down_lst.append(img.crop((abs(pos[0]), 58, abs(pos[0]) + 10, img.height)))

        x_offset = 0
        # 創(chuàng)建一張畫布,x_offset主要為新畫布使用
        new_img = Image.new("RGB", (260, img.height))
        for img in image_upper_lst:
            new_img.paste(img, (x_offset, 58))
            x_offset += img.width

        x_offset = 0
        for img in image_down_lst:
            new_img.paste(img, (x_offset, 0))
            x_offset += img.width

        return new_img

    # 判斷顏色是否相近
    def is_similar_color(self, x_pixel, y_pixel):
        for i, pixel in enumerate(x_pixel):
            if abs(y_pixel[i] - pixel) > 50:
                return False
        return True

    # 計算距離
    def get_offset_distance(self, cut_image, full_image):
        for x in range(cut_image.width):
            for y in range(cut_image.height):
                cpx = cut_image.getpixel((x, y))
                fpx = full_image.getpixel((x, y))
                if not self.is_similar_color(cpx, fpx):
                    img = cut_image.crop((x, y, x + 50, y + 40))
                    # 保存一下計算出來位置圖片由驹,看看是不是缺口部分
                    img.save("1.jpg")
                    return x

    # 開始移動
    def start_move(self, distance):
        element = self.driver.find_element_by_xpath('//div[@class="gt_slider_knob gt_show"]')

        # 這里就是根據(jù)移動進(jìn)行調(diào)試芍锚,計算出來的位置不是百分百正確的,加上一點偏移
        distance -= element.size.get('width') / 2
        distance += 15

        # 按下鼠標(biāo)左鍵
        ActionChains(self.driver).click_and_hold(element).perform()
        time.sleep(0.5)
        while distance > 0:
            if distance > 10:
                # 如果距離大于10蔓榄,就讓他移動快一點
                span = random.randint(5, 8)
            else:
                # 快到缺口了并炮,就移動慢一點
                span = random.randint(2, 3)
            ActionChains(self.driver).move_by_offset(span, 0).perform()
            distance -= span
            time.sleep(random.randint(10, 50) / 100)

        ActionChains(self.driver).move_by_offset(distance, 1).perform()
        ActionChains(self.driver).release(on_element=element).perform()

if __name__ == "__main__":
    h = Vincent()
    h.visit_index()

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市甥郑,隨后出現(xiàn)的幾起案子逃魄,更是在濱河造成了極大的恐慌,老刑警劉巖澜搅,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件伍俘,死亡現(xiàn)場離奇詭異,居然都是意外死亡店展,警方通過查閱死者的電腦和手機(jī)养篓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來赂蕴,“玉大人柳弄,你說我怎么就攤上這事「潘担” “怎么了碧注?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長糖赔。 經(jīng)常有香客問我萍丐,道長,這世上最難降的妖魔是什么放典? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任逝变,我火速辦了婚禮基茵,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘壳影。我一直安慰自己拱层,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布宴咧。 她就那樣靜靜地躺著根灯,像睡著了一般。 火紅的嫁衣襯著肌膚如雪掺栅。 梳的紋絲不亂的頭發(fā)上烙肺,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天,我揣著相機(jī)與錄音氧卧,去河邊找鬼桃笙。 笑死,一個胖子當(dāng)著我的面吹牛假抄,可吹牛的內(nèi)容都是我干的怎栽。 我是一名探鬼主播,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼宿饱,長吁一口氣:“原來是場噩夢啊……” “哼熏瞄!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起谬以,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤强饮,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后为黎,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體邮丰,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年铭乾,在試婚紗的時候發(fā)現(xiàn)自己被綠了剪廉。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,577評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡炕檩,死狀恐怖斗蒋,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情笛质,我是刑警寧澤泉沾,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站妇押,受9級特大地震影響跷究,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜敲霍,卻給世界環(huán)境...
    茶點故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一俊马、第九天 我趴在偏房一處隱蔽的房頂上張望丁存。 院中可真熱鬧,春花似錦柴我、人聲如沸柱嫌。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至与学,卻和暖如春彤悔,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背索守。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工晕窑, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人卵佛。 一個月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓杨赤,卻偏偏與公主長得像,于是被迫代替她去往敵國和親截汪。 傳聞我的和親對象是個殘疾皇子疾牲,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,452評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 在前面一篇博客,介紹了 Selenium 的基本用法和爬蟲開發(fā)過程中經(jīng)常使用的一些小技巧衙解,利用這些寫出一個瀏覽器爬...
    FifiZhuang閱讀 10,966評論 4 81
  • 2008年7月2日阳柔,也就是農(nóng)歷的五月二十九,我的母親去世了蚓峦,距今已經(jīng)過去了九年舌剂。再有兩天就是農(nóng)歷的五月二十九...
    一埝閱讀 485評論 0 1
  • 1、啟動注冊中心springcloud-eureka-server spring.cloud.EurekaServ...
    BUG弄潮兒閱讀 556評論 0 0
  • 車?yán)孀影严囝櫉o言赫然備注給了一個人暑椰,而是在陰差陽錯遇到的一個人霍转。他叫顧睿,長著一張梨子比較順眼的模樣一汽。 梨子對男朋...
    于多萌閱讀 1,009評論 0 0