記python登陸學(xué)校教務(wù)系統(tǒng)踩過的坑

最近開發(fā)關(guān)于學(xué)校服務(wù)類小程序,小程序后臺需要從學(xué)校的系統(tǒng)獲取到各同學(xué)的信息缘厢,所以語言優(yōu)先選擇了python吃度,并用了Django框架。之前也有寫過一些爬蟲贴硫,但都是用其他語言寫的椿每。對python并不熟悉,所以這次開發(fā)踩了不少坑夜畴,也走了不少彎路拖刃。在這里總結(jié)一下,分享給同樣有需要的人贪绘。

學(xué)校的登陸流程是這樣的:

登陸流程圖

正確登陸流程應(yīng)該是上圖的那樣的,但是如果登陸錯(cuò)誤是不會(huì)獲取到302頁的央碟,而是直接返回登陸頁税灌,python獲取到的狀態(tài)碼也是200均函。

在這里我就犯了一個(gè)很嚴(yán)重的錯(cuò)誤,我一直以為我post登陸是正確的菱涤,從而把bug定位到【python獲取不到302驗(yàn)證頁】這個(gè)問題上苞也,一開始先百度,得出的答案是在requests.post請求中添加allow_redirects=False來禁止網(wǎng)頁重定向粘秆,我發(fā)現(xiàn)還是沒有獲取到302頁如迟,從而轉(zhuǎn)向更底層的httplib和自定義自己的urlib的重定向類。發(fā)現(xiàn)還是不行攻走,困擾了我一天殷勘,終于在我祭出fiddler之后,bug慢慢顯現(xiàn)出來昔搂。


fd第一步:抓包

通過fd分別抓取瀏覽器和pycharm Post請求包

fd抓包

fd第二步:對比

pycharm_post表單
firefox_post表單

對比pycharm和瀏覽器向教務(wù)系統(tǒng)服務(wù)器發(fā)出的請求包內(nèi)容發(fā)現(xiàn)玲销,

username,password摘符,imgcode以及cookies兩邊都是一樣的

而user_lb這個(gè)字段兩邊不一樣pycharm請求的是中文瀏覽器則是亂碼


難道就是因?yàn)檫@個(gè)字段編碼問題導(dǎo)致服務(wù)器驗(yàn)證失斚托薄?

接下來分析一下pycharm的編碼

在python3中默認(rèn)是Unicode編碼逛裤,我們在使用requests發(fā)送post請求的時(shí)候瘩绒,python會(huì)默認(rèn)使用utf-8編碼data表單數(shù)據(jù),而學(xué)校的表單卻是以gbk編碼提交带族,是真的很奇葩锁荔,目前來說只有非常古老的網(wǎng)站才采用gbk編碼了。

下面我們來改一下代碼


postdata = {

    'imgcode': input(),

    'password':input(),

    'user_lb':'學(xué)生',---->  'user_lb':'學(xué)生'.encode('gbk'),

    'username':input(),

}

提示:在Python3中炉菲,decode是把二進(jìn)制字符串解碼成Unicode碼堕战,encode則是把Unicode碼轉(zhuǎn)換成對應(yīng)的二進(jìn)制字符串

修改完以后再一次驗(yàn)證

pycharm_post登陸

就此困擾了我兩天的問題終于成功解決,拿到了sessid拍霜,之后通過設(shè)置相應(yīng)的cookies便可以對學(xué)生信息頁進(jìn)行相應(yīng)的操作了嘱丢。

貼個(gè)登陸時(shí)序圖方便理解吧

login時(shí)序圖

總結(jié):我最后只用了【.encode('gbk')】就解決了問題,所以說請求的時(shí)候祠饺,編碼很重要越驻,編碼錯(cuò)誤很可能導(dǎo)致服務(wù)端拿不到正確的請求內(nèi)容,從而爬蟲也接收不到正確的響應(yīng)內(nèi)容道偷。

本文原創(chuàng)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末缀旁,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子勺鸦,更是在濱河造成了極大的恐慌并巍,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,919評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件换途,死亡現(xiàn)場離奇詭異懊渡,居然都是意外死亡刽射,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,567評論 3 392
  • 文/潘曉璐 我一進(jìn)店門剃执,熙熙樓的掌柜王于貴愁眉苦臉地迎上來誓禁,“玉大人,你說我怎么就攤上這事肾档∧∏。” “怎么了?”我有些...
    開封第一講書人閱讀 163,316評論 0 353
  • 文/不壞的土叔 我叫張陵怒见,是天一觀的道長俗慈。 經(jīng)常有香客問我,道長速种,這世上最難降的妖魔是什么姜盈? 我笑而不...
    開封第一講書人閱讀 58,294評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮配阵,結(jié)果婚禮上馏颂,老公的妹妹穿的比我還像新娘。我一直安慰自己棋傍,他們只是感情好救拉,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,318評論 6 390
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著瘫拣,像睡著了一般亿絮。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上麸拄,一...
    開封第一講書人閱讀 51,245評論 1 299
  • 那天派昧,我揣著相機(jī)與錄音,去河邊找鬼拢切。 笑死蒂萎,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的淮椰。 我是一名探鬼主播五慈,決...
    沈念sama閱讀 40,120評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼主穗!你這毒婦竟也來了泻拦?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,964評論 0 275
  • 序言:老撾萬榮一對情侶失蹤忽媒,失蹤者是張志新(化名)和其女友劉穎争拐,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體晦雨,經(jīng)...
    沈念sama閱讀 45,376評論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡陆错,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,592評論 2 333
  • 正文 我和宋清朗相戀三年灯抛,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了金赦。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片音瓷。...
    茶點(diǎn)故事閱讀 39,764評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖夹抗,靈堂內(nèi)的尸體忽然破棺而出绳慎,到底是詐尸還是另有隱情,我是刑警寧澤漠烧,帶...
    沈念sama閱讀 35,460評論 5 344
  • 正文 年R本政府宣布杏愤,位于F島的核電站,受9級特大地震影響已脓,放射性物質(zhì)發(fā)生泄漏珊楼。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,070評論 3 327
  • 文/蒙蒙 一度液、第九天 我趴在偏房一處隱蔽的房頂上張望厕宗。 院中可真熱鬧,春花似錦堕担、人聲如沸已慢。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,697評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽佑惠。三九已至,卻和暖如春齐疙,著一層夾襖步出監(jiān)牢的瞬間膜楷,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,846評論 1 269
  • 我被黑心中介騙來泰國打工贞奋, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留赌厅,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,819評論 2 370
  • 正文 我出身青樓忆矛,卻偏偏與公主長得像察蹲,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子催训,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,665評論 2 354

推薦閱讀更多精彩內(nèi)容