記python登陸學(xué)校教務(wù)系統(tǒng)踩過的坑

最近開發(fā)關(guān)于學(xué)校服務(wù)類小程序，小程序后臺需要從學(xué)校的系統(tǒng)獲取到各同學(xué)的信息缘厢，所以語言優(yōu)先選擇了python吃度，并用了Django框架。之前也有寫過一些爬蟲贴硫，但都是用其他語言寫的椿每。對python并不熟悉，所以這次開發(fā)踩了不少坑夜畴，也走了不少彎路拖刃。在這里總結(jié)一下，分享給同樣有需要的人贪绘。

學(xué)校的登陸流程是這樣的：

登陸流程圖

正確登陸流程應(yīng)該是上圖的那樣的，但是如果登陸錯(cuò)誤是不會(huì)獲取到302頁的央碟，而是直接返回登陸頁税灌，python獲取到的狀態(tài)碼也是200均函。

在這里我就犯了一個(gè)很嚴(yán)重的錯(cuò)誤，我一直以為我post登陸是正確的菱涤，從而把bug定位到【python獲取不到302驗(yàn)證頁】這個(gè)問題上苞也，一開始先百度，得出的答案是在requests.post請求中添加allow_redirects=False來禁止網(wǎng)頁重定向粘秆，我發(fā)現(xiàn)還是沒有獲取到302頁如迟，從而轉(zhuǎn)向更底層的httplib和自定義自己的urlib的重定向類。發(fā)現(xiàn)還是不行攻走，困擾了我一天殷勘，終于在我祭出fiddler之后，bug慢慢顯現(xiàn)出來昔搂。

fd第一步：抓包

通過fd分別抓取瀏覽器和pycharm Post請求包

fd抓包

fd第二步：對比

pycharm_post表單

firefox_post表單

對比pycharm和瀏覽器向教務(wù)系統(tǒng)服務(wù)器發(fā)出的請求包內(nèi)容發(fā)現(xiàn)玲销，

username，password摘符，imgcode以及cookies兩邊都是一樣的

而user_lb這個(gè)字段兩邊不一樣pycharm請求的是中文瀏覽器則是亂碼

難道就是因?yàn)檫@個(gè)字段編碼問題導(dǎo)致服務(wù)器驗(yàn)證失斚托薄？

接下來分析一下pycharm的編碼

在python3中默認(rèn)是Unicode編碼逛裤，我們在使用requests發(fā)送post請求的時(shí)候瘩绒，python會(huì)默認(rèn)使用utf-8編碼data表單數(shù)據(jù)，而學(xué)校的表單卻是以gbk編碼提交带族，是真的很奇葩锁荔，目前來說只有非常古老的網(wǎng)站才采用gbk編碼了。

下面我們來改一下代碼


postdata = {

    'imgcode': input(),

    'password':input(),

    'user_lb':'學(xué)生',---->  'user_lb':'學(xué)生'.encode('gbk'),

    'username':input(),

}

提示：在Python3中炉菲，decode是把二進(jìn)制字符串解碼成Unicode碼堕战，encode則是把Unicode碼轉(zhuǎn)換成對應(yīng)的二進(jìn)制字符串

修改完以后再一次驗(yàn)證

pycharm_post登陸

就此困擾了我兩天的問題終于成功解決，拿到了sessid拍霜，之后通過設(shè)置相應(yīng)的cookies便可以對學(xué)生信息頁進(jìn)行相應(yīng)的操作了嘱丢。

貼個(gè)登陸時(shí)序圖方便理解吧

login時(shí)序圖

總結(jié)：我最后只用了【.encode('gbk')】就解決了問題，所以說請求的時(shí)候祠饺，編碼很重要越驻，編碼錯(cuò)誤很可能導(dǎo)致服務(wù)端拿不到正確的請求內(nèi)容，從而爬蟲也接收不到正確的響應(yīng)內(nèi)容道偷。

本文原創(chuàng)

最后編輯于：2018.05.08 22:51:47

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末缀旁，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子勺鸦，更是在濱河造成了極大的恐慌并巍，老刑警劉巖，帶你破解...
沈念sama閱讀 216,919評論 6贊 502
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件换途，死亡現(xiàn)場離奇詭異懊渡，居然都是意外死亡刽射，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,567評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門剃执，熙熙樓的掌柜王于貴愁眉苦臉地迎上來誓禁，“玉大人，你說我怎么就攤上這事肾档∧∏。” “怎么了？”我有些...
開封第一講書人閱讀 163,316評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵怒见，是天一觀的道長俗慈。經(jīng)常有香客問我，道長速种，這世上最難降的妖魔是什么姜盈？我笑而不...
開封第一講書人閱讀 58,294評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮配阵，結(jié)果婚禮上馏颂，老公的妹妹穿的比我還像新娘。我一直安慰自己棋傍，他們只是感情好救拉，可當(dāng)我...
茶點(diǎn)故事閱讀 67,318評論 6贊 390
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著瘫拣，像睡著了一般亿絮。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上麸拄，一...
開封第一講書人閱讀 51,245評論 1贊 299
城市分裂傳說
那天派昧，我揣著相機(jī)與錄音，去河邊找鬼拢切。笑死蒂萎，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的淮椰。我是一名探鬼主播五慈，決...
沈念sama閱讀 40,120評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼主穗！你這毒婦竟也來了泻拦？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 38,964評論 0贊 275
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤忽媒，失蹤者是張志新（化名）和其女友劉穎争拐，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體晦雨，經(jīng)...
沈念sama閱讀 45,376評論 1贊 313
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡陆错，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,592評論 2贊 333
?白月光啟示錄
正文我和宋清朗相戀三年灯抛，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了金赦。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片音瓷。...
茶點(diǎn)故事閱讀 39,764評論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖夹抗，靈堂內(nèi)的尸體忽然破棺而出绳慎，到底是詐尸還是另有隱情，我是刑警寧澤漠烧，帶...
沈念sama閱讀 35,460評論 5贊 344
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布杏愤，位于F島的核電站，受9級特大地震影響已脓，放射性物質(zhì)發(fā)生泄漏珊楼。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,070評論 3贊 327
男人毒藥：我在死后第九天來索命
文/蒙蒙一度液、第九天我趴在偏房一處隱蔽的房頂上張望厕宗。院中可真熱鬧，春花似錦堕担、人聲如沸已慢。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,697評論 0贊 22
一樁弒父案霹购，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽佑惠。三九已至，卻和暖如春齐疙，著一層夾襖步出監(jiān)牢的瞬間膜楷，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,846評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工贞奋，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留赌厅，地道東北人。一個(gè)月前我還...
沈念sama閱讀 47,819評論 2贊 370
代替公主和親
正文我出身青樓忆矛，卻偏偏與公主長得像察蹲，于是被迫代替她去往敵國和親。傳聞我的和親對象是個(gè)殘疾皇子催训，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,665評論 2贊 354