目標(biāo)網(wǎng)站:http://best.zhaopin.com/?sid=121128100&site=sou
1.分析
- 先手動投票查看網(wǎng)頁提交的請求
通過分析可以看到網(wǎng)頁實(shí)際上并沒有針對同一IP的投票進(jìn)行限制,所以不需要進(jìn)行使用代理IP曙砂,但是為了使我們的代碼更加符合常規(guī)網(wǎng)站的對同一IP限制投票的機(jī)制斯碌,所以這里抓取一個代理IP的網(wǎng)站進(jìn)行點(diǎn)擊投票
提供不錯幾個的短期代理IP網(wǎng)站
但是不翩,這些免費(fèi)開放代理一般會有很多人都在使用,而且代理有壽命短啡捶,速度慢利凑,匿名度不高卸勺,HTTP/HTTPS支持不穩(wěn)定等缺點(diǎn)(免費(fèi)沒好貨)砂沛。
- 目標(biāo)網(wǎng)址:西刺免費(fèi)代理IP
2.小試牛刀(代碼基于Python 2.7)
#-*- coding:utf-8 -*-
import requests
import json
import re
import random
import sys
import time
import datetime #處理日期和時間的標(biāo)準(zhǔn)庫
import threading #引入多線程
from random import choice #choice() 方法返回一個列表曙求,元組或字符串的隨機(jī)項(xiàng)
from bs4 import BeautifulSoup
from fake_useragent import UserAgent #引入userAgent
def get_ip():
'''獲取代理IP'''
url = 'http://www.xicidaili.com/nn'
my_headers = {
'Accept': 'text/html, application/xhtml+xml, application/xml;',
'Accept-Encoding': 'gzip, deflate, sdch',
'Accept-Language': 'zh-CN,zh;q=0.8',
'Referer': 'http: // www.xicidaili.com/nn',
'User-Agent': 'Mozilla / 5.0(Windows NT 6.1;WOW64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 45.0.2454.101Safari / 537.36'
}
r = requests.get(url,headers=my_headers)
soup = BeautifulSoup(r.text,'html.parser')
data = soup.find_all('td')
#定義IP和端口Pattern規(guī)則
ip_compile = re.compile(r'<td>(\d+\.\d+\.\d+\.\d+)</td>') #匹配IP
port_compile = re.compile(r'<td>(\d+)</td>') #匹配端口
ip = re.findall(ip_compile,str(data)) #獲取所有IP
port = re.findall(port_compile,str(data)) #獲取所有端口
z = [':'.join(i) for i in zip(ip,port)] #列表生成式
print z
#組合IP和端口
return z
# 設(shè)置user-agent列表,每次請求時碍庵,隨機(jī)挑選一個user-agent
ua_list = UserAgent()
print ua_list.random
def get_url(url,code=0,ips=[]):
'''
投票
如果因?yàn)榇鞩P已失效造成投票失敗,則會自動換一個代理IP后繼續(xù)投票
:param code:
:param ips:
:return:
'''
try:
ip = choice(ips)
except:
return False
else:
#指定IP
proxies = {
'http':ip
}
headers = {
'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
'Host': 'best.zhaopin.com',
'Origin': 'https: // best.zhaopin.com',
'Referer':'https//best.zhaopin.com/?sid=121128100&site=sou',
# 'User-Agent':choice(ua_list)
'User-Agent': ua_list.random
}
print ua_list.random
try:
data = {"bestid": "3713", "score": "5,5,5,5,5,5","source": "best",}
result = requests.post(url=url,data=data, proxies=proxies,) # 跳過證書的驗(yàn)證 verify=False
except requests.exceptions.ConnectionError:
print 'ConnectionError'
if not ips:
print 'ip 已失效'
sys.exit()
#刪除不可用的代理IP
if ip in ips:
ips.remove(ip)
#重新請求url
get_url(url,code=0,ips=[])
else:
date = datetime.datetime.now().strftime('%H:%M:%S')
# result.text() 投票成功顯示1 失敗顯示0
print u"第%s次 [%s] [%s]:投票%s (剩余可用代理IP數(shù):%s)" % (code, date, ip, result.text, len(ips))
def get_num(num):
#點(diǎn)贊的請求
url1 = 'https://best.zhaopin.com/API/Vote.ashx'
#投票的請求
url2 = 'https://best.zhaopin.com/API/ScoreCompany.ashx'
if num == 1:
url=url1
main(url)
elif num == 2:
url =url2
main(url)
else:
print '您的輸入有誤悟狱,請重新輸入>苍 !挤渐!'
num = int(raw_input('自主刷贊請選1苹享,自動投票請選2:'))
get_num(num)
def main(url):
ips = []
#xrange() 生成的是一個生成器
for i in xrange(6000):
# 每隔1000次重新獲取一次最新的代理IP,每次可獲取最新的100個代理IP
if i % 1000 == 0:
ips.extend(get_ip())
print '--------------------------------------'
print ips
#啟動線程浴麻,每隔1s產(chǎn)生一個線程得问,可通過控制時間加快投票速度
t1 = threading.Thread(target=get_url,args=(url,i,ips))
t1.start()
time.sleep(1) #time.sleep的最小單位是毫秒
if __name__ == '__main__':
# #點(diǎn)贊的請求
# url1 = 'https://best.zhaopin.com/API/Vote.ashx'
# #投票的請求
# url2 = 'https://best.zhaopin.com/API/ScoreCompany.ashx'
print '歡迎使用自助刷票小工具QAQ'
num = int(raw_input('自主刷贊請選1,自動投票請選2:'))
get_num(num)
- 運(yùn)行程序