第1章最后的好多庫裝不上张足,應(yīng)該是Windows不支持,用Linux或者M(jìn)ac可以
第2章
基本知識: HTTP原理, 網(wǎng)頁的基礎(chǔ)知識嫉鲸, 爬蟲的基本原理, Cookies的基本原理歹啼。
2.1 HTTP基本原理
2.1.1 URI和URL
Uniform Resource Identifier統(tǒng)一資源標(biāo)識符
Universal Resource Locator統(tǒng)一資源定位符
Universal Resource Name統(tǒng)一資源名稱
2.1.2 超文本
hypertext
2.1.3 HTTP和HTTPS
Hyper Text Transfer Protocol 超文本傳輸協(xié)議
Hyper Text Transfer Protocol over Secure Socket Layer 在HTTP下加入SSL層玄渗,簡稱為HTTPS
2.1.4 HTTP 請求過程
2.15 請求
請求方法(Request Method)
請求網(wǎng)址(Request URL)
請求頭(Request Headers)
請求體(Request Body)
請求的方法 GET和POST
get會(huì)包含在URL中,長度有限制
post會(huì)通過表單上傳狸眼,不會(huì)出現(xiàn)在URL中藤树,長度沒限制,提交賬號密碼拓萌,還有上傳文件比較大的時(shí)候
其他請求方法
方法? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 描述
GET? ? ? ? ? ? ? ? ? 請求頁面岁钓,并返回頁面內(nèi)容
HEAD? ? ? ? ? ? ? ?類似于GET請求,只不過返回的相應(yīng)中沒有具體的內(nèi)容微王,用于獲取抱頭
POST? ? ? ? ? ? ? ?大多數(shù)用于提交表單或者上傳文件屡限,數(shù)據(jù)包含在請求體中
PUT? ? ? ? ? ? ? ? ?從客戶端向服務(wù)器傳送的數(shù)據(jù)取代指定文檔中的內(nèi)容
DELETE? ? ? ? ?請求服務(wù)器刪除指定的頁面
CONNECT? ? ?把服務(wù)器當(dāng)作跳板,讓服務(wù)器替代客戶端訪問其他頁面
OPTIONS? ? ?允許客戶端查看服務(wù)器的性能
TRACE? ? ? ?回顯服務(wù)器收到的請求炕倘,主要用于測試或診斷
2. 請求的網(wǎng)址
3. 請求頭
Accept:請求報(bào)頭域钧大,?
Accept-Language:
Accept-Encoding:
Host:
Cookies:
Referer:
User-Agent:
Content-Type: 也叫互聯(lián)網(wǎng)媒體類型或者M(jìn)IME類型。
4. 請求體
請求體一般承載的內(nèi)容是POST請求中的表單數(shù)據(jù)罩旋,而對于GET請求啊央,請求體則為空
2.1.6 響應(yīng)
響應(yīng)可以分為三部分:響應(yīng)狀態(tài)碼(Response Status Code)? 響應(yīng)頭(Response Headers)和響應(yīng)體(Response Body)
1 響應(yīng)狀態(tài)碼
2 響應(yīng)頭
Date
Last-Modified
Content-Type
Set-Cookie
Expires:
3 響應(yīng)體
響應(yīng)的正文都在響應(yīng)體里面。
2.2 網(wǎng)頁的基礎(chǔ)
2.2.1 網(wǎng)頁的組成
網(wǎng)頁三大部分----HTML涨醋, CSS 和JavaScript瓜饥。 把網(wǎng)頁比作一個(gè)人的話,HTML相當(dāng)于骨架东帅,JavaScript相當(dāng)于肌肉压固,CSS相當(dāng)于皮膚。
1.HTML
HTML是用來描述網(wǎng)頁的一種語言靠闭,其全稱叫做Hyper Text Markup Language帐我,即超文本標(biāo)記語言。網(wǎng)頁包括文字愧膀,按鈕拦键,圖片和視頻等各種復(fù)雜的元素。
2.CSS
? ? Cascading Style Sheets,層疊樣式表
3.JavaScript
簡稱JS檩淋,是一種腳本語言芬为,產(chǎn)生了實(shí)時(shí)萄金,動(dòng)態(tài),交互的網(wǎng)頁功能媚朦。
HTML定義了網(wǎng)頁的內(nèi)容和結(jié)構(gòu)氧敢,CSS描述了網(wǎng)頁的布局,JavaScript定義了網(wǎng)頁的行為
2.2.2 網(wǎng)頁的結(jié)構(gòu)
各種標(biāo)簽
2.2.3 節(jié)點(diǎn)樹及節(jié)點(diǎn)間的關(guān)系
在HTML中询张,所有的標(biāo)簽定義的內(nèi)容都是節(jié)點(diǎn)孙乖,它們構(gòu)成了一個(gè)HTML DOM樹。