前言
在上次做完圖形驗(yàn)證碼后工窍,發(fā)現(xiàn)識別率不盡人意粉私,可以說是很不滿意汰蓉,稍微有點(diǎn)更多的干擾,打印出來的字符一塌糊涂蹋宦!這次轉(zhuǎn)手對極驗(yàn)的滑動(dòng)驗(yàn)證碼進(jìn)行識別。咒锻。冷冗。
- 目前市面上越來越多的網(wǎng)站的注冊登錄用滑動(dòng)驗(yàn)證碼進(jìn)行驗(yàn)證,與人互動(dòng)的形式來判定你是不是人類操作惑艇,所以說蒿辙,我們要進(jìn)行破解,就是模仿人體操作進(jìn)行識別與通過驗(yàn)證滨巴!
- 還有一些注意問題后面說思灌,通常也是識別不成功的關(guān)鍵!
- 識別率估摸著有90%以上了恭取!
正序
- 要用到的:selenium泰偿、PIL、io秽荤、Chrome瀏覽器甜奄、還有驅(qū)動(dòng)瀏覽器的插件chromediver
流程邏輯
- 打開網(wǎng)頁柠横,進(jìn)入驗(yàn)證頁面
- 點(diǎn)擊驗(yàn)證按鈕,獲取完整圖片與帶缺口的圖片進(jìn)行比對(現(xiàn)在的極驗(yàn)驗(yàn)證碼已經(jīng)不能直接獲取完整圖片了课兄。牍氛。。)
- 計(jì)算偏移量
- selenium控制滑塊填補(bǔ)空缺烟阐,驗(yàn)證完成搬俊!
- 封裝類,多個(gè)方法實(shí)現(xiàn)功能
- 初始化值蜒茄,打開網(wǎng)頁唉擂,程序完成自動(dòng)結(jié)束!
class CrackGeetest():
def __init__(self):
self.url = 'https://www.geetest.com/type/'
self.browser = webdriver.Chrome()
self.wait = WebDriverWait(self.browser, 20)
# 程序完成檀葛,自動(dòng)結(jié)束程序
def __del__(self):
self.browser.close()
def open(self):
"""
打開網(wǎng)頁
:return: None
"""
self.browser.get(self.url)
- 進(jìn)入驗(yàn)證頁面玩祟,獲取驗(yàn)證按鈕與驗(yàn)證碼的位置
def get_geetest_button(self):
"""
獲取初始驗(yàn)證按鈕
:return:
"""
# 驗(yàn)證按鈕
button = self.wait.until(EC.element_to_be_clickable((By.CLASS_NAME, 'geetest_radar_tip')))
return button
def get_position(self):
"""
獲取驗(yàn)證碼位置
:return: 驗(yàn)證碼位置元組
"""
img = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'geetest_canvas_img')))
print('img')
location = img.location
size = img.size
top, bottom, left, right = location['y'], location['y'] + size['height'], location['x'], location['x'] + size[
'width']
return (top, bottom, left, right)
- 這個(gè)時(shí)候,就可以看到帶缺口圖片驗(yàn)證的界面
- 之前的極驗(yàn)驗(yàn)證碼是會(huì)出現(xiàn)完整圖片∮炝現(xiàn)在直接就顯示了帶缺口圖片的驗(yàn)證空扎,通過搜羅網(wǎng)上的一些解決方法,發(fā)現(xiàn)有一個(gè)study隱藏屬性:
如果把這個(gè)屬性刪除就會(huì)出現(xiàn)完整圖片:
通過對CSS的更改润讥,所以這樣我們就能獲取完整圖片 - 同時(shí)獲取帶缺口的圖片加入帶缺口圖片進(jìn)行對比转锈,獲取偏移量!(PIL)
def get_screenshot(self):
"""
獲取網(wǎng)頁截圖
:return: 截圖對象
"""
screenshot = self.browser.get_screenshot_as_png()
screenshot = Image.open(BytesIO(screenshot))
return screenshot
def get_geetest_image(self, name='captcha.png'):
"""
獲取驗(yàn)證碼圖片
:return: 圖片對象
"""
top, bottom, left, right = self.get_position()
print('驗(yàn)證碼位置', top, bottom, left, right)
screenshot = self.get_screenshot()
captcha = screenshot.crop((left, top, right, bottom))
captcha.save(name)
return captcha
def delete_style(self):
'''
執(zhí)行js腳本楚殿,獲取無滑塊圖
:return None
'''
js = 'document.querySelectorAll("canvas")[2].style=""'
self.browser.execute_script(js)
def get_gap(self, image1, image2):
"""
獲取缺口偏移量
:param image1: 帶缺口圖片
:param image2: 不帶缺口圖片
:return:
"""
left = 60
print(image1.size[0])
print(image1.size[1])
for i in range(left, image1.size[0]):
for j in range(image1.size[1]):
if not self.is_pixel_equal(image1, image2, i, j):
left = i
return left
return left
def is_pixel_equal(self, image1, image2, x, y):
"""
判斷兩個(gè)像素是否相同
:param image1: 圖片1
:param image2: 圖片2
:param x: 位置x
:param y: 位置y
:return: 像素是否相同
"""
# 取兩個(gè)圖片的像素點(diǎn)
pixel1 = image1.load()[x, y]
pixel2 = image2.load()[x, y]
threshold = 60
if abs(pixel1[0] - pixel2[0]) < threshold and abs(pixel1[1] - pixel2[1]) < threshold and abs(
pixel1[2] - pixel2[2]) < threshold:
return True
else:
return False
- 然后我們根據(jù)偏移量獲取移動(dòng)軌跡撮慨,控制滑塊,填補(bǔ)缺口脆粥!
- 由于驗(yàn)證碼的特殊性砌溺,我們是不能控制滑塊勻速滑過去的(人類是做不到的),極驗(yàn)在此也是做了驗(yàn)證的冠绢!所以我們按照人操作抚吠,先加速后減速做個(gè)優(yōu)化!
def get_track(self, distance):
"""
根據(jù)偏移量獲取移動(dòng)軌跡
:param distance: 偏移量
:return: 移動(dòng)軌跡
"""
# 移動(dòng)軌跡
track = []
# 當(dāng)前位移
current = 0
# 減速閾值
mid = distance * 4 / 5
# 計(jì)算間隔
t = 0.2
# 初速度
v = 0
while current < distance:
if current < mid:
# 加速度為正2
a = 2
else:
# 加速度為負(fù)3
a = -1
# 初速度v0
v0 = v
# 當(dāng)前速度v = v0 + at
v = v0 + a * t
# 移動(dòng)距離x = v0t + 1/2 * a * t^2
move = v0 * t + 1 / 2 * a * t * t
# 當(dāng)前位移
current += move
# 加入軌跡
track.append(round(move))
return track
def move_to_gap(self, slider, track):
"""
拖動(dòng)滑塊到缺口處
:param slider: 滑塊
:param track: 軌跡
:return:
"""
ActionChains(self.browser).click_and_hold(slider).perform()
for x in track:
ActionChains(self.browser).move_by_offset(xoffset=x, yoffset=0).perform()
time.sleep(0.5)
ActionChains(self.browser).release().perform()
注意問題
-
不管是電腦設(shè)置還是瀏覽器設(shè)置的縮放都要改成100%?Α!7趸А萧朝!
否則就會(huì)影響圖片的截取與偏移量的錯(cuò)誤計(jì)算,總的來說就是識別會(huì)失斚目蕖<旒怼!!(話說我就因?yàn)橄到y(tǒng)設(shè)置沒改何址,栽在這有段時(shí)間了里逆。。用爪。)
- 其他的問題原押,無非就是插件版本不對、編寫代碼等問題偎血。