爬蟲入門教程④— 必備知識(shí)基礎(chǔ)(三)網(wǎng)頁的構(gòu)成

如果把整個(gè)絢麗的網(wǎng)頁看成一個(gè)人的話裹唆,那么html就是這個(gè)人的骨肉瓤摧,css則是好看的外表,JS則能讓這個(gè)人成長(zhǎng)挂滓,移動(dòng)苦银,甚至是放大縮小啸胧。
所以這節(jié)讓我們一起探索這個(gè)“人”組成的奇妙之處。

我在網(wǎng)上找了個(gè)html網(wǎng)頁作為示范(這是個(gè)保留彩蛋)


網(wǎng)頁示例

看起來短短4行字符幔虏,但是它的源代碼卻遠(yuǎn)超過顯示出來的字符:

<html>
<head>
    <title>The Dormouse's story</title></head>
    <meta charset="UTF-8">
    <link rel="stylesheet" >
    <script src="http://www.xxx.com/xxx.js"></script>
</head>
<body>
    <p class="title"><b>The Dormouse's story</b></p>

    <p class="story">Once upon a time there were three little sisters; and their names were
        <a  class="sister" id="link1">Elsie</a>,
        <a  class="sister" id="link2">Lacie</a> and
        <a  class="sister" id="link3">Tillie</a>
        ;and they lived at the bottom of a well.
    </p>

<p class="story">...</p>
</body>
</html>

源代碼由最外層的<html>標(biāo)簽包裹纺念,<html>內(nèi)部是<head><body>想括。
head標(biāo)簽:里面一般會(huì)存放這個(gè)網(wǎng)頁的一些設(shè)置陷谱、CSS 和 JS 文件,設(shè)置比如字符集<meta charset="UTF-8">是告訴瀏覽器瑟蜈,網(wǎng)頁的編碼按照UTF-8來解析烟逊,以免出現(xiàn)亂碼。
body就是我們看到的內(nèi)容了铺根,一般在body的結(jié)尾或者</body>后面有一些js文件的引入或者代碼宪躯。
CSS文件引入代碼:

<link rel="stylesheet" >

JS文件引入代碼:

<script src="http://www.xxx.com/xxx.js"></script>

簡(jiǎn)介完成,下面詳細(xì)介紹:

1. HTML

超文本標(biāo)記語言位迂,標(biāo)準(zhǔn)通用標(biāo)記語言下的一個(gè)應(yīng)用访雪。

超文本就是指頁面內(nèi)可以包含圖片、鏈接掂林,甚至音樂臣缀、程序等非文字元素。

超文本標(biāo)記語言的結(jié)構(gòu)包括頭”部分(英語:Head)泻帮、和“主體”部分(英語:Body)精置,其中“頭”部提供關(guān)于網(wǎng)頁的信息,“主體”部分提供網(wǎng)頁的具體內(nèi)容锣杂。

我們看到的整個(gè)源代碼就是一個(gè)HTML文件脂倦,這個(gè)文件是我們發(fā)起請(qǐng)求,然后服務(wù)器返回給我們的響應(yīng)的一部分蹲堂。
瀏覽器收到響應(yīng)后狼讨,開始解析html文件,采用從上到下的流程柒竞,逐步渲染頁面。把內(nèi)容顯示出來播聪。所以加載網(wǎng)頁是有一個(gè)過程的朽基,并不是迅速就能出現(xiàn)的。

html標(biāo)簽由很多個(gè)節(jié)點(diǎn)(Tag离陶、Node)組成稼虎。比如 head 、 body 招刨、 p 霎俩、 a 。這些節(jié)點(diǎn)之間的關(guān)系有父子關(guān)系、兄弟關(guān)系打却。
父子關(guān)系:子節(jié)點(diǎn)被包括在父節(jié)點(diǎn)中杉适。比如body內(nèi)的所有標(biāo)簽,都是body的子節(jié)點(diǎn)柳击。
兄弟關(guān)系:兩個(gè)節(jié)點(diǎn)位于同一層級(jí)猿推,比如我們的所有的p標(biāo)簽。他們的直接父節(jié)點(diǎn)都是body捌肴。

其中每個(gè)節(jié)點(diǎn)都可以有自己的一些屬性蹬叭,比如:classhref状知,src秽五,id。這些屬性決定了他們的特點(diǎn):
class:通常情況下饥悴,我們用class為節(jié)點(diǎn)加上樣式坦喘。
href:這是一個(gè)錨點(diǎn),如果href的值是一個(gè)互聯(lián)網(wǎng)地址铺坞,那么它就會(huì)呈現(xiàn)一個(gè)鏈接的樣式起宽。
src:一般我們?cè)?img 和 script 標(biāo)簽中使用,用來引用圖片或者js文件济榨,它的值就是文件的地址坯沪。
idid 通常在一個(gè)網(wǎng)頁是唯一的,為了便于給它加上一個(gè)特別的樣式或者便于js找到它擒滑。

2. CSS

層疊樣式表(英文全稱:Cascading Style Sheets)是一種用來表現(xiàn)HTML標(biāo)準(zhǔn)通用標(biāo)記語言的一個(gè)應(yīng)用)或XML(標(biāo)準(zhǔn)通用標(biāo)記語言的一個(gè)子集)等文件樣式的計(jì)算機(jī)語言况鸣。CSS不僅可以靜態(tài)地修飾網(wǎng)頁,還可以配合各種腳本語言動(dòng)態(tài)地對(duì)網(wǎng)頁各元素進(jìn)行格式化隧魄。 [1]

CSS 能夠?qū)W(wǎng)頁中元素位置的排版進(jìn)行像素級(jí)精確控制茫孔,支持幾乎所有的字體字號(hào)樣式,擁有對(duì)網(wǎng)頁對(duì)象和模型樣式編輯的能力库车。

?
css長(zhǎng)這樣:

.pull-right {
  float: right;
}
.pull-left {
  float: left;
}

.pull-right就是設(shè)置 class 為 pull-right 的節(jié)點(diǎn)的樣式巨柒。float: right則是設(shè)置樣式為向右浮動(dòng)。CSS的作用是巨大的柠衍,我們看到的顏色洋满、點(diǎn)擊效果、背景顏色等等珍坊,都是由CSS設(shè)置的牺勾。
但是呢,在寫爬蟲的時(shí)候阵漏,我們基本上不必管css驻民。因?yàn)閏ss里面只有外觀樣式翻具,并沒有對(duì)我們有利的信息。

3. JS

JavaScript一種直譯式腳本語言回还,是一種動(dòng)態(tài)類型裆泳、弱類型、基于原型的語言懦趋,內(nèi)置支持類型晾虑。它的解釋器被稱為JavaScript引擎,為瀏覽器的一部分仅叫,廣泛用于客戶端的腳本語言帜篇,最早是在HTML(標(biāo)準(zhǔn)通用標(biāo)記語言下的一個(gè)應(yīng)用)網(wǎng)頁上使用,用來給HTML網(wǎng)頁增加動(dòng)態(tài)功能诫咱。

?
首先要聲明的一點(diǎn):javascript 和 java 除了都是編程語言之外笙隙,沒有任何關(guān)系,沒有任何關(guān)系竟痰,沒有任何關(guān)系~!

JS是可以在瀏覽器里面運(yùn)行的編程語言掏呼。它的特點(diǎn):
① JS可以在瀏覽器端進(jìn)行運(yùn)算
??比如在你輸入密碼的時(shí)候坏快,當(dāng)你密碼不合格,比如少于6位的時(shí)候憎夷,網(wǎng)頁會(huì)出現(xiàn)密碼過短的提示莽鸿。這就是JS獲取到了你輸入的密碼,然后計(jì)算出位數(shù)過少拾给,然后控制提示出現(xiàn)祥得。
題外話:最近出現(xiàn)的JS挖礦程序也是屬于這個(gè)范圍。當(dāng)你打開某個(gè)網(wǎng)頁之后蒋得,發(fā)現(xiàn)突然電腦變卡了级及,那就打開資源管理器,看看是不是瀏覽器占用了你大量的CPU資源额衙,如果是饮焦,那就可能遇到了讓你為別人挖礦的網(wǎng)頁了。
② JS可以發(fā)起請(qǐng)求并更新網(wǎng)頁 (敲黑板窍侧!劃重點(diǎn)追驴!)
??JS可以在不刷新網(wǎng)頁的前提下,向后臺(tái)發(fā)起請(qǐng)求疏之,然后單獨(dú)更新(增刪改)某一段網(wǎng)頁。我們稱之為 AJAX暇咆。我們常見的點(diǎn)擊加載更多锋爪、頁面劃到頁面底端自動(dòng)加載更多丙曙、點(diǎn)擊刪除某個(gè)節(jié)點(diǎn)、點(diǎn)擊刷新其骄,都屬于AJAX操作亏镰。這是爬蟲常見的障礙之一

?


傳送門:

下一章:
爬蟲入門教程⑤— 安裝Python

所有的章節(jié):

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末拯爽,一起剝皮案震驚了整個(gè)濱河市索抓,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌毯炮,老刑警劉巖逼肯,帶你破解...
    沈念sama閱讀 221,820評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異桃煎,居然都是意外死亡篮幢,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,648評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門为迈,熙熙樓的掌柜王于貴愁眉苦臉地迎上來三椿,“玉大人,你說我怎么就攤上這事葫辐∷衙蹋” “怎么了?”我有些...
    開封第一講書人閱讀 168,324評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵耿战,是天一觀的道長(zhǎng)蛋叼。 經(jīng)常有香客問我,道長(zhǎng)昆箕,這世上最難降的妖魔是什么鸦列? 我笑而不...
    開封第一講書人閱讀 59,714評(píng)論 1 297
  • 正文 為了忘掉前任,我火速辦了婚禮鹏倘,結(jié)果婚禮上薯嗤,老公的妹妹穿的比我還像新娘。我一直安慰自己纤泵,他們只是感情好骆姐,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,724評(píng)論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著捏题,像睡著了一般玻褪。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上公荧,一...
    開封第一講書人閱讀 52,328評(píng)論 1 310
  • 那天带射,我揣著相機(jī)與錄音,去河邊找鬼循狰。 笑死窟社,一個(gè)胖子當(dāng)著我的面吹牛券勺,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播灿里,決...
    沈念sama閱讀 40,897評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼关炼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了匣吊?” 一聲冷哼從身側(cè)響起儒拂,我...
    開封第一講書人閱讀 39,804評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎色鸳,沒想到半個(gè)月后社痛,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,345評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡缕碎,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,431評(píng)論 3 340
  • 正文 我和宋清朗相戀三年褥影,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片咏雌。...
    茶點(diǎn)故事閱讀 40,561評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡凡怎,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出赊抖,到底是詐尸還是另有隱情统倒,我是刑警寧澤,帶...
    沈念sama閱讀 36,238評(píng)論 5 350
  • 正文 年R本政府宣布氛雪,位于F島的核電站房匆,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏报亩。R本人自食惡果不足惜浴鸿,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,928評(píng)論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望弦追。 院中可真熱鬧岳链,春花似錦、人聲如沸劲件。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,417評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽零远。三九已至苗分,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間牵辣,已是汗流浹背摔癣。 一陣腳步聲響...
    開封第一講書人閱讀 33,528評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人供填。 一個(gè)月前我還...
    沈念sama閱讀 48,983評(píng)論 3 376
  • 正文 我出身青樓拐云,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親近她。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,573評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容