繼《百度翻譯最新接口破解》發(fā)出之后贺纲,很多朋友反饋請(qǐng)求始終是 998 的問題
這里特地單獨(dú)寫一篇實(shí)例來解析
關(guān)于 token 和 gtk 參數(shù)的獲取以及 sign 參數(shù)加密校驗(yàn)的過程請(qǐng)參考《百度翻譯最新接口破解》
本實(shí)例采用 Python3
進(jìn)行編寫
獲取 token 和 gtk 代碼如下
# 請(qǐng)求頭非常重要幌缝,在請(qǐng)求 fanyi.baidu.com 這個(gè)頁面的時(shí)候需要傳遞
# 筆者測(cè)試時(shí)發(fā)現(xiàn)备典,如果不傳遞的話百度也會(huì)返回 token 和 gtk,但是此時(shí)返回的值是無法正確請(qǐng)求到翻譯結(jié)果的
header = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36",
"Cookie": "'locale=zh; BAIDUID=FC2689968A662FA6104AA311FE89635B:FG=1; from_lang_often=%5B%7B%22value%22%3A%22en%22%2C%22text%22%3A%22%u82F1%u8BED%22%7D%2C%7B%22value%22%3A%22zh%22%2C%22text%22%3A%22%u4E2D%u6587%22%7D%5D; REALTIME_TRANS_SWITCH=1; FANYI_WORD_SWITCH=1; HISTORY_SWITCH=1; SOUND_SPD_SWITCH=1; SOUND_PREFER_SWITCH=1; to_lang_often=%5B%7B%22value%22%3A%22zh%22%2C%22text%22%3A%22%u4E2D%u6587%22%7D%2C%7B%22value%22%3A%22en%22%2C%22text%22%3A%22%u82F1%u8BED%22%7D%5D'",
}
# 獲取網(wǎng)頁源碼
html = requests.get('http://fanyi.baidu.com', headers=header)
html.encoding = 'utf-8'
# 正則匹配 gtk
matches = re.findall("window.gtk = '(.*?)';", html.text, re.S)
for match in matches:
gtk = match
if gtk == "":
print('Get gtk fail.')
exit()
print('gtk = ' + gtk)
# 正則匹配 token
matches = re.findall("token: '(.*?)'", html.text, re.S)
for match in matches:
token = match
if token == "":
print('Get token fail.')
exit()
print('token = ' + token)
獲取到 token 和 gtk 之后艰赞,我們需要對(duì)待翻譯的內(nèi)容進(jìn)行加密佣谐,這一步中返回的 sign 可以在百度的翻譯頁面中進(jìn)行校驗(yàn),查看對(duì)錯(cuò)與否
# 計(jì)算 sign
signCode = 'function a(r,o){for(var t=0;t<o.length-2;t+=3){var a=o.charAt(t+2);a=a>="a"?a.charCodeAt(0)-87:Number(a),a="+"===o.charAt(t+1)?r>>>a:r<<a,r="+"===o.charAt(t)?r+a&4294967295:r^a}return r}var C=null;var hash=function(r,_gtk){var o=r.length;o>30&&(r=""+r.substr(0,10)+r.substr(Math.floor(o/2)-5,10)+r.substr(-10,10));var t=void 0,t=null!==C?C:(C=_gtk||"")||"";for(var e=t.split("."),h=Number(e[0])||0,i=Number(e[1])||0,d=[],f=0,g=0;g<r.length;g++){var m=r.charCodeAt(g);128>m?d[f++]=m:(2048>m?d[f++]=m>>6|192:(55296===(64512&m)&&g+1<r.length&&56320===(64512&r.charCodeAt(g+1))?(m=65536+((1023&m)<<10)+(1023&r.charCodeAt(++g)),d[f++]=m>>18|240,d[f++]=m>>12&63|128):d[f++]=m>>12|224,d[f++]=m>>6&63|128),d[f++]=63&m|128)}for(var S=h,u="+-a^+6",l="+-3^+b+-f",s=0;s<d.length;s++)S+=d[s],S=a(S,u);return S=a(S,l),S^=i,0>S&&(S=(2147483647&S)+2147483648),S%=1e6,S.toString()+"."+(S^h)}'
source = '今天天氣怎么樣'
sign = execjs.compile(signCode).call('hash', source, gtk)
print('source = ' + source + ', sign = ' + sign)
有了 token 和 sign方妖,我們就可以開始構(gòu)建請(qǐng)求了
先來看一個(gè)可以正常返回結(jié)果的請(qǐng)求
http://fanyi.baidu.com/v2transapi?from=zh&to=en&query=%E4%BB%8A%E5%A4%A9%E5%A4%A9%E6%B0%94%E6%80%8E%E4%B9%88%E6%A0%B7&transtype=translang&simple_means_flag=3&sign=719145.924184&token=187678c6ec320a5f5e4e0620799970e5
其中的參數(shù)在《百度翻譯最新接口破解》中已經(jīng)進(jìn)行說明狭魂,from 和 to 可以由用戶輸入,query 的加密使用的 URLEncode,python 中實(shí)現(xiàn)的代碼是 urllib.parse.quote('需要翻譯的內(nèi)容')
接下來非常重要的是雌澄,千萬不要使用 POST 請(qǐng)求 http://fanyi.baidu.com/v2transapi 這個(gè)接口斋泄,會(huì)返回 998,會(huì)返回 998镐牺,會(huì)返回 998
具體原因不太清楚
我們需要做的是炫掐,按照正常的請(qǐng)求地址拼接一個(gè)我們需要的鏈接,然后 everything is ok~
請(qǐng)求代碼如下
# 請(qǐng)求接口
fromLanguage = 'zh'
toLanguage = 'en'
v2transapi = 'http://fanyi.baidu.com/v2transapi?from=%s&to=%s&query=%s' \
'&transtype=translang&simple_means_flag=3&sign=%s&token=%s' % (fromLanguage, toLanguage, urllib.parse.quote(source), sign, token)
print(v2transapi)
translate_result = requests.get(v2transapi, headers=header)
print(translate_result.text)
根據(jù)上面提供的 3 段代碼大家應(yīng)該可以正常獲取返回結(jié)果睬涧,廢話不說了卒废,源碼點(diǎn)此下載