python requests和response

2020年5月21號, 和往常一樣底燎,都只是普通的一天蠢络,但是今天碰到了一個事情:很多時候我們寫完爬蟲,都是為了抓取數(shù)據(jù)給到別人,但是如果這個數(shù)據(jù)是需要實時更新的无切,那怎么辦? 豈不是自己天天抓取完荡短,再把數(shù)據(jù)給到他人。這樣子其實很麻煩订雾。于是肢预,我就開始著手如何把python項目打包成exe文件。

于是我就上了pyinstaller, 按照網(wǎng)上的教程把scrapy工程導(dǎo)出成exe, 但是導(dǎo)出完成之后, 發(fā)現(xiàn)在我的電腦上運行是OK的洼哎,但是其他人的電腦上不行烫映。然后作為小白的自己不知道該何去何從,scrapy是我自己用的最順手的爬蟲工具噩峦《Ч担可是涉及到的文件確實很多,打包的話也容易出問題识补。

自己公司電腦正常運行

打包完成之后的部分文件族淮,文件還是比較多的。

打包完成之后的文件?

其他人的電腦運行結(jié)果:

在個人電腦的運行結(jié)果

自己暫時沒有想到如何去修改凭涂,于是就想著如果不是用scrapy寫程序呢祝辣?打包的話是不是比較簡單。于是自己沒有用scrapy切油,用的是python自帶的requests重寫了爬蟲的代碼.

由于自己之前一直用的scrapy, 習(xí)慣了那個框架蝙斜,現(xiàn)在出來之后開始寫,還是挺不習(xí)慣的澎胡。最難的部分是以前自己一直在scrapy中一直用XPATH來解析response中的內(nèi)容并提取孕荠,可以說是非常熟練,現(xiàn)在突然換回來攻谁,一下子不知道該如何處理稚伍。

于是自己就去網(wǎng)上看了別人的方法,發(fā)現(xiàn)其實也是可以用xpath的戚宦,這個模塊叫做lxml个曙。

導(dǎo)入lxml
xpath解析response

在scrapy里面, xpath的使用方法是

value = response.xpath("http://表達(dá)式").extract()

不使用scrapy的時候, 其實是分成了兩步:

1)獲取網(wǎng)頁的源代碼, 處理成節(jié)點, 也就是 r = etree.HTML(response.text)

2)第二步是對處理后的r使用xpath,方法是value = r.xpath("http://表達(dá)式")

是沒有extract()這個方法的.

依靠著lxml阁苞,延續(xù)了自己使用xpath快速查找內(nèi)容的方法困檩。最終完成了爬蟲的編寫。并且在最后打包成exe的時候那槽,只生成了一個文件悼沿,同時可以在其他人的電腦上順利運行。


打包結(jié)果

由于過去的一年多骚灸,自己頻繁使用了scrapy糟趾,現(xiàn)在上手request和response覺得難度不大,很多地方都是相似的。scrapy是一個高級版本义郑,框架完善蝶柿。但是基本的requests卻給了我更多的靈活性。以前使用scrapy, 要編寫setting, item, 爬蟲文件等等. 現(xiàn)在只需要一個py文件就可以完成了. 相信之后自己會使用requests和selenium來完成自己更多的爬蟲項目.

selenium: 優(yōu)勢在于爬蟲過程中如果需要登錄驗證的話非驮,scrapy和requests往往步驟繁多交汤,驗證起來很困難。selenium就是操作瀏覽器劫笙,沒有這方面的顧慮芙扎,特別是一些網(wǎng)站反爬蟲特別厲害的,使用selenium雖然效率低填大,但是能解決大部分驗證和反爬蟲的問題戒洼。

Scrapy:完善的爬蟲框架,適合新手使用允华,框架已經(jīng)弄好圈浇。按照這個框架填寫自己想要的內(nèi)容,可以在前期讓自己專注于代碼的編寫和糾錯靴寂。性能也很強大磷蜀,效率高,一直很喜歡它百炬。適合大的項目蠕搜。

requests:適合小項目,靈活性高收壕。

目前,本人是三者都使用轨蛤,根據(jù)不同的目標(biāo)選擇不同的方案蜜宪。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市祥山,隨后出現(xiàn)的幾起案子圃验,更是在濱河造成了極大的恐慌,老刑警劉巖缝呕,帶你破解...
    沈念sama閱讀 211,376評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件澳窑,死亡現(xiàn)場離奇詭異,居然都是意外死亡供常,警方通過查閱死者的電腦和手機摊聋,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,126評論 2 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來栈暇,“玉大人麻裁,你說我怎么就攤上這事。” “怎么了煎源?”我有些...
    開封第一講書人閱讀 156,966評論 0 347
  • 文/不壞的土叔 我叫張陵色迂,是天一觀的道長。 經(jīng)常有香客問我手销,道長歇僧,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,432評論 1 283
  • 正文 為了忘掉前任锋拖,我火速辦了婚禮诈悍,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘姑隅。我一直安慰自己写隶,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,519評論 6 385
  • 文/花漫 我一把揭開白布讲仰。 她就那樣靜靜地躺著慕趴,像睡著了一般。 火紅的嫁衣襯著肌膚如雪鄙陡。 梳的紋絲不亂的頭發(fā)上冕房,一...
    開封第一講書人閱讀 49,792評論 1 290
  • 那天,我揣著相機與錄音趁矾,去河邊找鬼耙册。 笑死,一個胖子當(dāng)著我的面吹牛毫捣,可吹牛的內(nèi)容都是我干的详拙。 我是一名探鬼主播,決...
    沈念sama閱讀 38,933評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼蔓同,長吁一口氣:“原來是場噩夢啊……” “哼饶辙!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起斑粱,我...
    開封第一講書人閱讀 37,701評論 0 266
  • 序言:老撾萬榮一對情侶失蹤弃揽,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后则北,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體矿微,經(jīng)...
    沈念sama閱讀 44,143評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,488評論 2 327
  • 正文 我和宋清朗相戀三年尚揣,在試婚紗的時候發(fā)現(xiàn)自己被綠了涌矢。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,626評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡快骗,死狀恐怖蒿辙,靈堂內(nèi)的尸體忽然破棺而出拇泛,到底是詐尸還是另有隱情,我是刑警寧澤思灌,帶...
    沈念sama閱讀 34,292評論 4 329
  • 正文 年R本政府宣布俺叭,位于F島的核電站,受9級特大地震影響泰偿,放射性物質(zhì)發(fā)生泄漏熄守。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,896評論 3 313
  • 文/蒙蒙 一耗跛、第九天 我趴在偏房一處隱蔽的房頂上張望裕照。 院中可真熱鬧,春花似錦调塌、人聲如沸晋南。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽负间。三九已至,卻和暖如春姜凄,著一層夾襖步出監(jiān)牢的瞬間政溃,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工态秧, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留董虱,地道東北人。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓申鱼,卻偏偏與公主長得像愤诱,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子捐友,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,494評論 2 348