python爬蟲入門(一)

網絡爬蟲介紹與作用

是一種按照一定的規(guī)則,自動的抓取萬維網信息的程序或者腳本团搞。包括數據請求严望、處理、存儲三個方面逻恐。

爬蟲的作用:獲取想要的信息像吻,比如圖片峻黍、數據、視頻等等拨匆。只要你能通過瀏覽器訪問的信息都可以通過爬蟲獲取姆涩。

工欲善其事,必先利其器

windows安裝python2.7的方式有兩種:

1)通過anaconda2.0安裝

2)直接下載python2.7或者其它版本安裝包進行安裝

Requests請求庫

通過pip install requests進行安裝惭每。一般用requests來對URL進行請求并接受返回的結果骨饿。

BeautifulSoup4解析庫

通過pip install beautifulsoup4進行安裝 ,利用bs4對返回的結果進行解析台腥,獲取想要爬取的目標數據宏赘。

查看電腦上安裝的所有模塊:win+R,輸入cmd,輸入python -m pip list顯示所有的python模塊览爵,如圖一:

圖一

HTTP常用的兩種請求方法get和post

例如:url = "https://www.baidu.com"

? ? ? ? ? ?response =? requests.get(url,headers = headers)

get請求方法置鼻,在客戶端不發(fā)送數據

post請求方法,在客戶端發(fā)送數據蜓竹,比如登錄知乎時箕母,需要輸入用戶名和密碼.

查看一個URL網址的請求方法,可以通過右擊網頁---審查元素/檢查-----Network----刷新網頁----name下第一個URL----Headers進行查看俱济。不同的瀏覽器查看方法會有一些差異嘶是。

圖二

User-Agent(用戶代理)

訪問url網址時,http請求的頭文件里都會包含一個User-Agent蛛碌,它是一個特殊字符頭聂喇,使服務器能夠識別客戶使用的操作系統(tǒng)及版本、瀏覽器及版本蔚携、瀏覽器語言及插件等信息希太。通過偽裝用戶代理標識,讓爬蟲檢查機器當你的爬蟲當成一個瀏覽器訪問網頁的人酝蜒,達到可以通行的目的誊辉。例如:

User-Agent:Mozilla/5.0 (Windows NT 6.1;WOW64)?

AppleWebKit/537.36 (KHTML, like Gecko)?

Chrome/63.0.3239.132Safari/537.36

在圖二查看Request Method方法時,user_agent的標識在response headers部分標識亡脑。如圖:

以上是爬蟲相關概念的說明堕澄。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市霉咨,隨后出現的幾起案子蛙紫,更是在濱河造成了極大的恐慌,老刑警劉巖途戒,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件坑傅,死亡現場離奇詭異,居然都是意外死亡喷斋,警方通過查閱死者的電腦和手機唁毒,發(fā)現死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進店門矢渊,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人枉证,你說我怎么就攤上這事∫票兀” “怎么了室谚?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長崔泵。 經常有香客問我秒赤,道長,這世上最難降的妖魔是什么憎瘸? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任入篮,我火速辦了婚禮,結果婚禮上幌甘,老公的妹妹穿的比我還像新娘潮售。我一直安慰自己,他們只是感情好锅风,可當我...
    茶點故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布酥诽。 她就那樣靜靜地躺著,像睡著了一般皱埠。 火紅的嫁衣襯著肌膚如雪肮帐。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天边器,我揣著相機與錄音训枢,去河邊找鬼。 笑死忘巧,一個胖子當著我的面吹牛恒界,可吹牛的內容都是我干的。 我是一名探鬼主播袋坑,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼仗处,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了枣宫?” 一聲冷哼從身側響起婆誓,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎也颤,沒想到半個月后洋幻,有當地人在樹林里發(fā)現了一具尸體,經...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡翅娶,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年文留,在試婚紗的時候發(fā)現自己被綠了好唯。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,688評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡燥翅,死狀恐怖骑篙,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情森书,我是刑警寧澤靶端,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站凛膏,受9級特大地震影響杨名,放射性物質發(fā)生泄漏。R本人自食惡果不足惜猖毫,卻給世界環(huán)境...
    茶點故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一台谍、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧吁断,春花似錦趁蕊、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至骂因,卻和暖如春炎咖,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背寒波。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工乘盼, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人俄烁。 一個月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓绸栅,卻偏偏與公主長得像,于是被迫代替她去往敵國和親页屠。 傳聞我的和親對象是個殘疾皇子粹胯,可洞房花燭夜當晚...
    茶點故事閱讀 44,573評論 2 353