玩Python之HTTP代理

玩Python之HTTP代理

0x00 前言

大家對(duì)HTTP代理應(yīng)該都非常熟悉邢疙,它在很多方面都有著極為廣泛的應(yīng)用。HTTP代理分為正向代理和反向代理兩種望薄,后者一般用于將防火墻后面的服務(wù)提供給用戶訪問或者進(jìn)行負(fù)載均衡疟游,典型的有Nginx、HAProxy等痕支。本文所討論的是正向代理颁虐。

HTTP代理最常見的用途是用于網(wǎng)絡(luò)共享、網(wǎng)絡(luò)加速和網(wǎng)絡(luò)限制突破等卧须。此外另绩,HTTP代理也常用于Web應(yīng)用調(diào)試、Android/IOS APP 中所調(diào)用的Web API監(jiān)控和分析花嘶,目前的知名軟件有Fiddler笋籽、Charles、Burp Suite和mitmproxy等椭员。HTTP代理還可用于請(qǐng)求/響應(yīng)內(nèi)容修改车海,在不改變服務(wù)端的情況下為Web應(yīng)用增加額外的功能或者改變應(yīng)用行為等。

0x01 HTTP代理是什么

HTTP代理本質(zhì)上是一個(gè)Web應(yīng)用隘击,它和其他普通Web應(yīng)用沒有根本區(qū)別侍芝。HTTP代理收到請(qǐng)求后研铆,根據(jù)Header中Host字段的主機(jī)名和Get/POST請(qǐng)求地址綜合判斷目標(biāo)主機(jī),建立新的HTTP請(qǐng)求并轉(zhuǎn)發(fā)請(qǐng)求數(shù)據(jù)州叠,并將收到的響應(yīng)數(shù)據(jù)轉(zhuǎn)發(fā)給客戶端棵红。

如果請(qǐng)求地址是絕對(duì)地址,HTTP代理采用該地址中的Host咧栗,否則使用Header中的HOST字段窄赋。做一個(gè)簡(jiǎn)單測(cè)試,假設(shè)網(wǎng)絡(luò)環(huán)境如下:

  • 192.168.1.2 Web服務(wù)器
  • 192.168.1.3 HTTP代理服務(wù)器

使用telnet進(jìn)行測(cè)試

$ telnet 192.168.1.3
GET / HTTP/1.0
HOST: 192.168.1.2


注意最后需要連續(xù)兩個(gè)回車楼熄,這是HTTP協(xié)議要求忆绰。完成后,可以收到 http://192.168.1.2/ 的頁面內(nèi)容可岂。下面做一下調(diào)整错敢,GET請(qǐng)求時(shí)帶上絕對(duì)地址

$ telnet 192.168.1.3
GET http://httpbin.org/ip HTTP/1.0
HOST: 192.168.1.2


注意這里同樣設(shè)置了HOST為192.168.1.2,但運(yùn)行結(jié)果卻返回了 http://httpbin.org/ip 頁面的內(nèi)容缕粹,也就是公網(wǎng)IP地址信息稚茅。

從上面的測(cè)試過程可以看出,HTTP代理并不是什么很復(fù)雜的東西平斩,只要將原始請(qǐng)求發(fā)送到代理服務(wù)器即可亚享。在無法設(shè)置HTTP代理的情況下,對(duì)于少量Host需要走HTTP代理的場(chǎng)景來說绘面,最簡(jiǎn)單的方式就是將目標(biāo)Host域名的IP指向代理服務(wù)器欺税,可以采取修改hosts文件的方式來實(shí)現(xiàn)。

0x02 Python程序中設(shè)置HTTP代理

urllib2/urllib 代理設(shè)置

urllib2是Python標(biāo)準(zhǔn)庫揭璃,功能很強(qiáng)大晚凿,只是使用起來稍微麻煩一點(diǎn)。在Python 3中瘦馍,urllib2不再保留歼秽,遷移到了urllib模塊中。urllib2中通過ProxyHandler來設(shè)置使用代理服務(wù)器情组。

proxy_handler = urllib2.ProxyHandler({'http': '121.193.143.249:80'})
opener = urllib2.build_opener(proxy_handler)
r = opener.open('http://httpbin.org/ip')
print(r.read())

也可以用install_opener將配置好的opener安裝到全局環(huán)境中燥筷,這樣所有的urllib2.urlopen都會(huì)自動(dòng)使用代理。

urllib2.install_opener(opener)
r = urllib2.urlopen('http://httpbin.org/ip')
print(r.read())

在Python 3中院崇,使用urllib肆氓。

proxy_handler = urllib.request.ProxyHandler({'http': 'http://121.193.143.249:80/'})
opener = urllib.request.build_opener(proxy_handler)
r = opener.open('http://httpbin.org/ip')
print(r.read())

requests 代理設(shè)置

requests是目前最優(yōu)秀的HTTP庫之一,也是我平時(shí)構(gòu)造http請(qǐng)求時(shí)使用最多的庫亚脆。它的API設(shè)計(jì)非常人性化做院,使用起來很容易上手。給requests設(shè)置代理很簡(jiǎn)單,只需要給proxies設(shè)置一個(gè)形如 {'http': 'x.x.x.x:8080', 'https': 'x.x.x.x:8080'} 的參數(shù)即可键耕。其中http和https相互獨(dú)立寺滚。

In [5]: requests.get('http://httpbin.org/ip', proxies={'http': '121.193.143.249:80'}).json()
Out[5]: {'origin': '121.193.143.249'}

可以直接設(shè)置session的proxies屬性,省去每次請(qǐng)求都要帶上proxies參數(shù)的麻煩屈雄。

s = requests.session()
s.proxies = {'http': '121.193.143.249:80'}
print(s.get('http://httpbin.org/ip').json())

0x03 HTTP_PROXY / HTTPS_PROXY 環(huán)境變量

urllib2 和 Requests 庫都能識(shí)別 HTTP_PROXY 和 HTTPS_PROXY 環(huán)境變量村视,一旦檢測(cè)到這些環(huán)境變量就會(huì)自動(dòng)設(shè)置使用代理。這在用HTTP代理進(jìn)行調(diào)試的時(shí)候非常有用酒奶,因?yàn)椴挥眯薷拇a蚁孔,可以隨意根據(jù)環(huán)境變量來調(diào)整代理服務(wù)器的ip地址和端口。*nix中的大部分軟件也都支持HTTP_PROXY環(huán)境變量識(shí)別惋嚎,比如curl杠氢、wget、axel另伍、aria2c等鼻百。

$ http_proxy=121.193.143.249:80 python -c 'import requests; print(requests.get("http://httpbin.org/ip").json())'
{u'origin': u'121.193.143.249'}

$ http_proxy=121.193.143.249:80 curl httpbin.org/ip
{
  "origin": "121.193.143.249"
}

在IPython交互環(huán)境中,可能經(jīng)常需要臨時(shí)性地調(diào)試HTTP請(qǐng)求摆尝,可以簡(jiǎn)單通過設(shè)置 os.environ['http_proxy'] 增加/取消HTTP代理來實(shí)現(xiàn)温艇。

In [245]: os.environ['http_proxy'] = '121.193.143.249:80'
In [246]: requests.get("http://httpbin.org/ip").json()
Out[246]: {u'origin': u'121.193.143.249'}
In [249]: os.environ['http_proxy'] = ''
In [250]: requests.get("http://httpbin.org/ip").json()
Out[250]: {u'origin': u'x.x.x.x'}

0x04 MITM-Proxy

MITM 源于 Man-in-the-Middle Attack,指中間人攻擊堕汞,一般在客戶端和服務(wù)器之間的網(wǎng)絡(luò)中攔截勺爱、監(jiān)聽和篡改數(shù)據(jù)。

mitmproxy是一款Python語言開發(fā)的開源中間人代理神器讯检,支持SSL琐鲁,支持透明代理、反向代理视哑,支持流量錄制回放绣否,支持自定義腳本等誊涯。功能上同Windows中的Fiddler有些類似挡毅,但mitmproxy是一款console程序,沒有GUI界面暴构,不過用起來還算方便跪呈。使用mitmproxy可以很方便的過濾、攔截取逾、修改任意經(jīng)過代理的HTTP請(qǐng)求/響應(yīng)數(shù)據(jù)包耗绿,甚至可以利用它的scripting API,編寫腳本達(dá)到自動(dòng)攔截修改HTTP數(shù)據(jù)的目的砾隅。

# test.py
def response(flow):
    flow.response.headers["BOOM"] = "boom!boom!boom!"

上面的腳本會(huì)在所有經(jīng)過代理的Http響應(yīng)包頭里面加上一個(gè)名為BOOM的header误阻。用mitmproxy -s 'test.py'命令啟動(dòng)mitmproxy,curl驗(yàn)證結(jié)果發(fā)現(xiàn)的確多了一個(gè)BOOM頭。

$ http_proxy=localhost:8080 curl -I 'httpbin.org/get'
HTTP/1.1 200 OK
Server: nginx
Date: Thu, 03 Nov 2016 09:02:04 GMT
Content-Type: application/json
Content-Length: 186
Connection: keep-alive
Access-Control-Allow-Origin: *
Access-Control-Allow-Credentials: true
BOOM: boom!boom!boom!
...

顯然mitmproxy腳本能做的事情遠(yuǎn)不止這些究反,結(jié)合Python強(qiáng)大的功能寻定,可以衍生出很多應(yīng)用途徑。除此之外精耐,mitmproxy還提供了強(qiáng)大的API狼速,在這些API的基礎(chǔ)上,完全可以自己定制一個(gè)實(shí)現(xiàn)了特殊功能的專屬代理服務(wù)器卦停。

經(jīng)過性能測(cè)試向胡,發(fā)現(xiàn)mitmproxy的效率并不是特別高。如果只是用于調(diào)試目的那還好惊完,但如果要用到生產(chǎn)環(huán)境僵芹,有大量并發(fā)請(qǐng)求通過代理的時(shí)候,性能還是稍微差點(diǎn)小槐。我用twisted實(shí)現(xiàn)了一個(gè)簡(jiǎn)單的proxy淮捆,用于給公司內(nèi)部網(wǎng)站增加功能、改善用戶體驗(yàn)本股,以后有機(jī)會(huì)再和大家分享攀痊。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市拄显,隨后出現(xiàn)的幾起案子苟径,更是在濱河造成了極大的恐慌,老刑警劉巖躬审,帶你破解...
    沈念sama閱讀 222,104評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件棘街,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡承边,警方通過查閱死者的電腦和手機(jī)遭殉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,816評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來博助,“玉大人险污,你說我怎么就攤上這事「辉溃” “怎么了蛔糯?”我有些...
    開封第一講書人閱讀 168,697評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)窖式。 經(jīng)常有香客問我蚁飒,道長(zhǎng),這世上最難降的妖魔是什么萝喘? 我笑而不...
    開封第一講書人閱讀 59,836評(píng)論 1 298
  • 正文 為了忘掉前任淮逻,我火速辦了婚禮琼懊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘爬早。我一直安慰自己肩碟,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,851評(píng)論 6 397
  • 文/花漫 我一把揭開白布凸椿。 她就那樣靜靜地躺著削祈,像睡著了一般。 火紅的嫁衣襯著肌膚如雪脑漫。 梳的紋絲不亂的頭發(fā)上髓抑,一...
    開封第一講書人閱讀 52,441評(píng)論 1 310
  • 那天,我揣著相機(jī)與錄音优幸,去河邊找鬼吨拍。 笑死,一個(gè)胖子當(dāng)著我的面吹牛网杆,可吹牛的內(nèi)容都是我干的羹饰。 我是一名探鬼主播,決...
    沈念sama閱讀 40,992評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼碳却,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼队秩!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起昼浦,我...
    開封第一講書人閱讀 39,899評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤馍资,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后关噪,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體鸟蟹,經(jīng)...
    沈念sama閱讀 46,457評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,529評(píng)論 3 341
  • 正文 我和宋清朗相戀三年使兔,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了建钥。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,664評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡虐沥,死狀恐怖熊经,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情置蜀,我是刑警寧澤奈搜,帶...
    沈念sama閱讀 36,346評(píng)論 5 350
  • 正文 年R本政府宣布,位于F島的核電站盯荤,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏焕盟。R本人自食惡果不足惜秋秤,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,025評(píng)論 3 334
  • 文/蒙蒙 一宏粤、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧灼卢,春花似錦绍哎、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,511評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至涩咖,卻和暖如春海诲,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背檩互。 一陣腳步聲響...
    開封第一講書人閱讀 33,611評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工特幔, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人闸昨。 一個(gè)月前我還...
    沈念sama閱讀 49,081評(píng)論 3 377
  • 正文 我出身青樓蚯斯,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親饵较。 傳聞我的和親對(duì)象是個(gè)殘疾皇子拍嵌,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,675評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn)循诉,斷路器撰茎,智...
    卡卡羅2017閱讀 134,704評(píng)論 18 139
  • 一、概念(載錄于:http://www.cnblogs.com/EricaMIN1987_IT/p/3837436...
    yuantao123434閱讀 8,373評(píng)論 6 152
  • 暑假結(jié)束了打洼,今天正式開學(xué)龄糊。由于工作需要,調(diào)到小學(xué)部募疮,成為一年級(jí)小學(xué)生的語文老師炫惩。 因?yàn)橐?..
    小猴的美好時(shí)光閱讀 281評(píng)論 0 2
  • 有時(shí)候,我突然發(fā)覺這個(gè)世界上似乎冥冥之中存在著一種感覺阿浓,一種力量在引導(dǎo)他嚷,支配,預(yù)示著某些東西的因果芭毙。這種感覺是一種...
    莊德坤閱讀 238評(píng)論 0 0
  • 今天早上我有事出門一趟筋蓖,九點(diǎn)多老爸打開了電腦,不一會(huì)唉聲不斷退敦。等我忙完粘咖,在回家路上一看朋友圈,股市再次熔斷了侈百。 朋...
    淺唱也瘋狂閱讀 499評(píng)論 3 0