常規(guī)的網(wǎng)頁抓取或者設(shè)計簡單的js加密都可以很好的用http客戶端模擬出來
但是如果安全性高一些的網(wǎng)站重斑,比如銀行、酒店信息、某些工商網(wǎng)站的信息膜毁,這些站點(diǎn)的反扒措施往往做的比較好,其中一種比較頭疼的方式就是控件問題了愤钾,很多銀行都使用了安全控件的加密措施
模擬請求的話瘟滨,無法定位到input輸入框,即便用selenium也無法定位
這里就涉及到windows的機(jī)制了能颁,windows中每個窗口對象都有一個句柄標(biāo)識符杂瘸,用整型來標(biāo)識不同的句柄,可以調(diào)用win32的庫去通過句柄伙菊,定位到控件框
from ctypes import windll
u32 = windll.LoadLibrary('user32.dll')
注意user32.dll文件败玉,windows系統(tǒng)自帶的調(diào)用接口,里面的一些api镜硕,可以通過句柄定位到對應(yīng)的輸入框
切換輸入框的api:
def switch_to_hwnd(hwnd):
assert type(hwnd) == int
u32.SwitchToThisWindow(hwnd, True)
其中hwnd為int類型运翼,表示定位的句柄框
以上解決了第一個難題,接下來試著向控件框中輸入字符兴枯,就麻煩了血淌,selenium的driver.send_keys方法只能向普通的dom輸入框輸入字符,無法輸入控件
這里就需要鍵盤模擬程序來解決問題了,windows自帶了一個軟件盤悠夯,嘗試調(diào)用自帶軟鍵盤輸入癌淮,控件框并不能接收到字符,應(yīng)該是一種安全措施沦补,普通的輸入無法向輸入框中輸入字符
推薦的方案是乳蓄,調(diào)用winIO庫,使用更加底層的機(jī)制夕膀,該庫是c++實現(xiàn)的虚倒,python有對應(yīng)的封裝:
https://pypi.org/project/rabird.winio/
pypi有具體的使用方法
pypi給出示例代碼也很清晰,接口基本上已經(jīng)封裝好了
def key_press(scancode, press_time=0.2):
key_down(scancode)
time.sleep(press_time)
key_up(scancode)
調(diào)用這個函數(shù)就可以店诗,其中scancode是鍵盤信號映射裹刮,推薦把它放到字典中調(diào)用,可以從網(wǎng)上搜索到:
WIO_CODE = {
'backspace': 0x0E, 'tab': 0x0F, 'enter': 0x1C, 'caps_lock': 0x3A, 'esc': 0x01,
'spacebar': 0x39, '0': 0x0B, '1': 0x02, '2': 0x03, '3': 0x04, '4': 0x05,
'5': 0x06, '6': 0x07, '7': 0x08, '8': 0x09, '9': 0x0A, 'a': 0x1E, 'b': 0x30,
'c': 0x2E, 'd': 0x20, 'e': 0x12, 'f': 0x21, 'g': 0x22, 'h': 0x23, 'i': 0x17,
'j': 0x24, 'k': 0x25, 'l': 0x26, 'm': 0x32, 'n': 0x31, 'o': 0x18, 'p': 0x19,
'q': 0x10, 'r': 0x13, 's': 0x1F, 't': 0x14, 'u': 0x16, 'v': 0x2F, 'w': 0x11,
'x': 0x2D, 'y': 0x15, 'z': 0x2C, 'F1': 0x3B, 'F2': 0x3C, 'F3': 0x3D,
'F4': 0x3E,'F5': 0x3F, 'F6': 0x40, 'F7': 0x41, 'F8': 0x42, 'F9': 0x43,
'F10': 0x44, 'F11': 0x57, 'F12': 0x58, 'num_lock': 0x45, 'scroll_lock': 0x46,
'left_shift': 0x2A, 'right_shift ': 0x36,'left_control': 0x1D, ',': 0x33,
'-': 0x0C,'.': 0x34, '/': 0x35, '`': 0x29, ';': 0x27, '[': 0x1A,']': 0x1B,
}
遍歷要輸入的字符串庞瘸,調(diào)用key_press方法即可捧弃,大寫字母輸入要press一下CapsLock, 可以封裝一下具體輸入方法:
def input_key(element):
upper = 'QWERTYUIOPASDFGHJKLZXCVBNM'
# key_press(WIO_CODE['left_shift'])
if element in upper:
key_press(WIO_CODE['caps_lock'])
time.sleep(0.1)
key_press(WIO_CODE[element.lower()])
time.sleep(0.1)
key_press(WIO_CODE['caps_lock'])
else:
if element not in WIO_CODE:
print('error input char')
return False
key_press(WIO_CODE[element])
time.sleep(0.1)
return True
這樣,基本的問題就都解決啦