根據(jù)上篇pyppeteer 模擬人工滑動(dòng)驗(yàn)證(一)
我們現(xiàn)在繼續(xù)模擬人工滑動(dòng)驗(yàn)證。
請(qǐng)先看了上篇(pyppeteer 模擬人工滑動(dòng)驗(yàn)證(一))的基礎(chǔ)介紹盼玄,再看當(dāng)前篇
一贴彼、模擬的思路
人工滑動(dòng)的速度肯定是在變化的,大部分是先加速滑動(dòng)埃儿,然后再減速器仗,我們要模擬的也就是這樣的軌跡。
二童番、如何控制滑動(dòng)的速度
根據(jù) pyppeteer 提供的API page.mouse.move()唯一可以控制速度變化的就是steps, 源碼如下:
async def move(self, x: float, y: float, options: dict = None,
**kwargs: Any) -> None:
"""Move mouse cursor (dispatches a ``mousemove`` event).
Options can accepts ``steps`` (int) field. If this ``steps`` option
specified, Sends intermediate ``mousemove`` events. Defaults to 1.
"""
options = merge_dict(options, kwargs)
fromX = self._x
fromY = self._y
self._x = x
self._y = y
steps = options.get('steps', 1)
for i in range(1, steps + 1):
x = round(fromX + (self._x - fromX) * (i / steps))
y = round(fromY + (self._y - fromY) * (i / steps))
await self._client.send('Input.dispatchMouseEvent', {
'type': 'mouseMoved',
'button': self._button,
'x': x,
'y': y,
'modifiers': self._keyboard._modifiers,
})
大概看一下可以知道精钮,steps是將我們傳入的距離分成 ‘steps’ 段來執(zhí)行,steps越大 則 越耗時(shí)剃斧,滑動(dòng)越慢轨香,在這里使用 steps 來控制滑動(dòng)速度是很麻煩的,不如換一種思路幼东,將steps固定臂容,都是1,也就是滑動(dòng)一次的時(shí)間固定下來筋粗。那么在時(shí)間固定的情況下策橘,改變每次滑動(dòng)的距離就可以實(shí)現(xiàn)變速滑動(dòng)
三、如何滑動(dòng)指定的距離
通過調(diào)用page.mouse.move()娜亿,可以移動(dòng)到指定的 x , y丽已,要實(shí)現(xiàn)相對(duì)移動(dòng),則需要知道相對(duì)坐標(biāo)點(diǎn)买决,也就是傳入 start_x + space_x, start_y + space_y
start_x , start_y 是滑塊的坐標(biāo)沛婴,但是 pyppeteer 好像沒有提供這樣的方法。
再次觀察move() 的源碼督赤, 中間有一段 fromX = self._x 嘁灯; fromY = self._y
這個(gè) self是指鼠標(biāo) Mouse 對(duì)象,self._x 不就是當(dāng)前的橫坐標(biāo)嗎(調(diào)用hover(slide_id)后躲舌,我們已經(jīng)聚焦到滑塊上丑婿,也就是把鼠標(biāo)放在滑塊上了)。
start_x = page.mouse._x
await page.mouse.move(start_x + space_x, 0) # space_x 就是我們想要控制移動(dòng)的距離。
四羹奉、如何從滑動(dòng)的距離中切出來一塊塊的變速長(zhǎng)度
根據(jù) 二秒旋、三,我們已經(jīng)有大概的思路了诀拭,假如我們要滑動(dòng) 300 像素迁筛,可以把300 的長(zhǎng)度分成 10 段左右,前 7 段的長(zhǎng)度在遞增耕挨,后三段的長(zhǎng)度在遞減细卧。然后在每一段上執(zhí)行 page.mouse.move() 函數(shù)。
這里我們可以做一個(gè)等差數(shù)列生成器(或者等比數(shù)列)筒占,它應(yīng)該有兩個(gè)特點(diǎn)贪庙。
1)數(shù)列是先遞增,再遞減的
2)每次生成的數(shù)列應(yīng)該是隨機(jī)的(不可能一直使用同一個(gè)軌跡)赋铝。
具體怎么實(shí)現(xiàn)每個(gè)人都有自己的想法插勤,這里我借助 numpy 第三方庫,以及random標(biāo)準(zhǔn)庫完成了一個(gè)實(shí)現(xiàn)革骨。大概思路如下:
1)先依賴 numpy 生成一個(gè)標(biāo)準(zhǔn)的等差數(shù)列农尖,計(jì)算出數(shù)列的差值 origin_space。
2)數(shù)列的第一位不變良哲,但是后面不是加上標(biāo)準(zhǔn) origin_space,而是origin_space 上下浮動(dòng) 10% 盛卡,以實(shí)現(xiàn)每次都是隨機(jī)的。
import numpy, random
def random_linspace(num, length):
'''輔助函數(shù)
傳入要分成的幾段 -> num 筑凫;長(zhǎng)度 -> length, 生成一個(gè)遞增的滑沧、隨機(jī)的、不嚴(yán)格等差數(shù)列
'''
# 數(shù)列的起始值 巍实、 結(jié)束值滓技。 這里以平均值的 0.5 作為起始值,平均值的 1.5倍作為結(jié)束值棚潦。
start, end = 0.5 * (length / num), 1.5 * (length / num)
# 借助三方庫生成一個(gè)標(biāo)準(zhǔn)的等差數(shù)列令漂,主要是得出標(biāo)準(zhǔn)等差 space
origin_list = numpy.linspace(start, end, num)
space = origin_list[2] - origin_list[1]
# 在標(biāo)準(zhǔn)等差的基礎(chǔ)上,設(shè)置上下浮動(dòng)的大小丸边,(上下浮動(dòng)10%)
min_random, max_random = -(space / 10), space / 10
result = []
# 等差數(shù)列的初始值不變叠必,就是我們?cè)O(shè)置的start
value = start
# 將等差數(shù)列添加到 list
result.append(value)
# 初始值已經(jīng)添加,循環(huán)的次數(shù) 減一
for i in range(num - 1):
# 浮動(dòng)的等差值 space
random_space = space + random.uniform(min_random, max_random)
value += random_space
result.append(value)
return result
def slide_list(total_length):
'''等差數(shù)列生成器妹窖,根據(jù)傳入的長(zhǎng)度纬朝,生成一個(gè)隨機(jī)的,先遞增后遞減骄呼,不嚴(yán)格的等差數(shù)列'''
# 具體分成幾段是隨機(jī)的
total_num = random.randint(10, 15)
# 中間的拐點(diǎn)是隨機(jī)的
mid = total_num - random.randint(3, 5)
# 第一段共苛、第二段的分段數(shù)
first_num, second_num = mid, total_num - mid
# 第一段判没、第二段的長(zhǎng)度,根據(jù)總長(zhǎng)度俄讹,按比例分成
first_length, second_length = total_length * (first_num / total_num), total_length * (second_num / total_num)
# 調(diào)用上面的輔助函數(shù)哆致,生成兩個(gè)隨機(jī)等差數(shù)列
first_result = random_linspace(first_num, first_length)
second_result = random_linspace(second_num, second_length)
# 第二段等差數(shù)列進(jìn)行逆序排序
slide_result = first_result + second_result[::-1]
# 由于隨機(jī)性绕德,判斷一下總長(zhǎng)度是否滿足患膛,不滿足的再補(bǔ)上一段
if sum(slide_result) < total_length:
slide_result.append(total_length - sum(slide_result))
return slide_result
async def slide_move(page, slide_id)
await page_or_iframe.hover(slide_id)
await page.mouse.down()
slides = slide_list(300)
x = page.mouse._x
for distance in slides:
x += distance
await page.mouse.move(x, 0, )
await page.mouse.up()
==================================================================
后續(xù)更新
有看到別人的實(shí)現(xiàn)滑動(dòng)軌跡列表的實(shí)現(xiàn),這里也記錄一下耻蛇。
思路是相同的踪蹬,在時(shí)間不變
的情況下滑動(dòng)的每一段長(zhǎng)度
在不停的變化
這里運(yùn)用了一些物理知識(shí)來做軌跡可能
def slide_list(total_length):
'''
拿到移動(dòng)軌跡,模仿人的滑動(dòng)行為臣咖,先勻加速后勻減速
勻變速運(yùn)動(dòng)基本公式:
①v=v0+at
②s=v0t+?at2
③v2-v02=2as
:param total_length: 需要移動(dòng)的距離
:return: 每段移動(dòng)的距離列表
'''
#初速度
v=0
#單位時(shí)間為0.3s來統(tǒng)計(jì)軌跡跃捣,軌跡即0.3內(nèi)的位移
t=1
#位移/軌跡列表,列表內(nèi)的一個(gè)元素代表一個(gè)T時(shí)間單位的位移,t越大夺蛇,每次移動(dòng)的距離越大
slide_result =[]
#當(dāng)前的位移
current=0
#到達(dá)mid值開始減速
mid=total_length*4/5
while current < total_length:
if current < mid:
# 加速度越小疚漆,單位時(shí)間的位移越小,模擬的軌跡就越多越詳細(xì)
a= 2
else:
a=-3
#初速度
v0=v
#0.2秒時(shí)間內(nèi)的位移
s=v0*t+0.5*a*(t**2)
#當(dāng)前的位置
current+=s
#添加到軌跡列表
slide_result.append(round(s))
#速度已經(jīng)達(dá)到v,該速度作為下次的初速度
v=v0+a*t
return slide_result
我們輸入一個(gè)距離 total_length = 300,得到以下列表:
[1, 4, 7, 10, 13, 16, 19, 22, 24, 27, 30, 33, 36, 35, 31]
這是因?yàn)楫?dāng)初速度為零時(shí)刁赦,同一間隔的時(shí)間 T 內(nèi)娶聘,s 的距離成等差數(shù)列。
這個(gè)結(jié)果也和我們想要生成等差數(shù)列軌跡路線效果相同甚脉。
注:如果你采用后面的這個(gè)方法丸升,也要采用一些隨機(jī)函數(shù)。
pyppeteer文檔 https://miyakogi.github.io/pyppeteer/reference.html#mouse-class