一、靜態(tài)網(wǎng)頁資源
1.靜態(tài)網(wǎng)頁資源介紹
在網(wǎng)頁設計上喇澡,純粹HTML格式的網(wǎng)頁(可以包含圖片迅栅、視頻、JS(前端功能實現(xiàn))晴玖、CSS(樣式)等)通常被稱為“靜態(tài)網(wǎng)頁”库继,早期的網(wǎng)站大多都是靜態(tài)網(wǎng)頁制作的箩艺。靜態(tài)網(wǎng)頁是相對于動態(tài)網(wǎng)頁而言的,是指沒有后臺數(shù)據(jù)庫宪萄、不含程序(如php艺谆、jsp、asp)和可交互的網(wǎng)頁拜英。
2.靜態(tài)網(wǎng)頁資源特點
靜態(tài)網(wǎng)頁資源的特點是静汤,開發(fā)者編寫的是什么,它顯示的就是什么居凶、一旦編寫完成虫给,就不會有任何改變。靜態(tài)網(wǎng)頁的維護和更新相比較麻煩侠碧,每個不同的網(wǎng)頁都需要單獨編輯更新抹估,靜態(tài)網(wǎng)頁一般適用于更新較少的宣傳展示型網(wǎng)站,是早起(2000年以前)很多中小網(wǎng)站展示的形式弄兜。
靜態(tài)網(wǎng)頁資源的對應程序及資源文件的常見擴展名為:
純文本類程序或文件:如htm药蜻、html、xml替饿、shtml语泽、js、css等视卢。
圖片類文件或數(shù)據(jù)文檔踱卵,如jpg、gif据过、png惋砂、bmp、txt绳锅、doc西饵、ppt等。
視頻類流媒體文件榨呆,如mp4、swf庸队、avi积蜻、wmv、flv等彻消。
靜態(tài)網(wǎng)頁資源有幾個重要的特征:
(1)每個頁面都有一個固定的URL地址竿拆,且URL一般以.htm、.html宾尚、.shtml等常見形式為后綴丙笋,而且地址中不含有問號“谢澈?”或“&”等特殊符號。
(2)網(wǎng)頁內(nèi)容一經(jīng)發(fā)布到網(wǎng)站服務器上御板,無論是否有用戶訪問锥忿,每個網(wǎng)頁的內(nèi)容都是保存在網(wǎng)站服務器文件系統(tǒng)上的,也就是說怠肋,靜態(tài)網(wǎng)頁是實實在在保存在服務器上的文件實體敬鬓,每個網(wǎng)頁都是一個獨立的文件。
(3)網(wǎng)頁內(nèi)容是固定不變的笙各,因此钉答,容易被搜索引擎收錄(容易被用戶找到)(優(yōu)點)
(4)網(wǎng)頁沒有數(shù)據(jù)庫的支持,在網(wǎng)站制作的維護方面工作面比較大杈抢,因此當網(wǎng)站信息很大時完全依靠靜態(tài)網(wǎng)頁制作的方式比較困難(缺點)数尿。
(5)網(wǎng)頁的交互性較差,在程序功能實現(xiàn)方面有較大的限制(缺點)惶楼。
(6)網(wǎng)頁程序在用戶瀏覽器端解析右蹦,并且不需要讀取數(shù)據(jù)庫,因此服務器端可以接受更多的并發(fā)訪問鲫懒。當客戶端向服務請求數(shù)據(jù)時嫩实,服務器直接把數(shù)據(jù)從磁盤文件系統(tǒng)上返回(不作任何解析),待客戶端拿到數(shù)據(jù)后窥岩,在瀏覽器端解析展現(xiàn)出來(優(yōu)點)甲献。
3.靜態(tài)網(wǎng)頁語言
常見的靜態(tài)網(wǎng)頁語言有html、js颂翼、css晃洒、xml、shtml等朦乏。
二球及、動態(tài)網(wǎng)頁資源
1.動態(tài)網(wǎng)頁資源介紹
所謂的動態(tài)網(wǎng)頁是與靜態(tài)網(wǎng)頁相對而言的,也就是說呻疹,動態(tài)網(wǎng)頁的URL后綴不是.htm吃引、.html、.shtml刽锤、.xml镊尺、.js、.css等靜態(tài)網(wǎng)頁常見的后綴擴展名形式并思,而是以.asp庐氮、.aspx、.php宋彼、.js弄砍、.do仙畦、.cgi等形式作為后綴的,并且一般在動態(tài)網(wǎng)頁網(wǎng)址中會有標志性的符號——“音婶?慨畸,&”,此外桃熄,在大多數(shù)情況下后綴都需要有數(shù)據(jù)庫的支持等先口。
2.動態(tài)網(wǎng)頁資源特點
(1)網(wǎng)頁擴展名后綴常見為:.asp、.aspx瞳收、.php碉京、.jsp、.do螟深、.cgi等谐宙。
(2)網(wǎng)頁一般以數(shù)據(jù)庫技術(shù)為基礎(chǔ),大大降低了網(wǎng)站維護的工作量界弧。
(3)采用動態(tài)網(wǎng)頁技術(shù)的網(wǎng)站可以實現(xiàn)更多的功能凡蜻,如用戶注冊、用戶登錄垢箕、在線調(diào)查划栓、投票、用戶管理条获、訂單管理忠荞、發(fā)博文等 。
(4)動態(tài)網(wǎng)頁并不是獨立存在于服務器上的網(wǎng)頁文件帅掘,當用戶請求服務器上的動態(tài)程序時委煤,服務器解析這些程序并可能讀取數(shù)據(jù)庫返回一個完整的網(wǎng)頁內(nèi)容。
(5)動態(tài)網(wǎng)頁中的“修档?”在搜索引擎的收錄方面存在一定的問題碧绞,搜索引擎一般不會從一個網(wǎng)站的數(shù)據(jù)庫中訪問全部網(wǎng)頁,或者出于技術(shù)等方面的考慮吱窝,搜索蜘蛛一般不會去抓取網(wǎng)址中的“讥邻?”后面的內(nèi)容,因此在企業(yè)通過搜索引擎進行推廣時院峡,需要針對采用動態(tài)網(wǎng)頁的網(wǎng)站做一定的技術(shù)處理(偽靜態(tài)技術(shù))兴使,以便適應搜索引擎的抓去要求。
(6)程序在服務器端解析撕予,這相當于顧客點餐鲫惶,飯店廚師做飯做菜蜈首,耗時長实抡,效率低欠母。由于程序在服務端解析,因此吆寨,會消耗大量的CPU和內(nèi)存赏淌、I/O等資源,并且多數(shù)還要讀取數(shù)據(jù)庫等服務啄清,因此六水,其訪問效率遠不如靜態(tài)網(wǎng)頁。
(7)在服務端解析動態(tài)程序的服務常見的有PHP引擎辣卒,Java容器(Tomcat掷贾、resin、Jboss荣茫、weblogic)想帅。
三、偽靜態(tài)網(wǎng)頁
1.偽靜態(tài)網(wǎng)頁介紹
偽靜態(tài)就是某些技術(shù)把動態(tài)網(wǎng)頁的URL地址偽裝成靜態(tài)網(wǎng)頁URL地址啡莉,但實質(zhì)上用戶訪問的還是動態(tài)網(wǎng)頁港准,只不過給用戶看起來URL地址是符合靜態(tài)網(wǎng)頁地質(zhì)特征的,因此咧欣,用戶及某些搜索引擎會誤認為是靜態(tài)網(wǎng)頁浅缸。
2.偽靜態(tài)網(wǎng)頁特點
從網(wǎng)站的URL地址看,偽靜態(tài)表面上看起來是靜態(tài)內(nèi)容魄咕,這是通過rewrite規(guī)則來實現(xiàn)的URL地址重寫衩椒。改寫后的URL地址規(guī)范、美觀蚕礼,有利于搜索引擎抓取烟具,以及提升用戶訪問體驗。從表面看奠蹬,兩個地址都是偽靜態(tài)的朝聋,因為偽靜態(tài)網(wǎng)頁還是動態(tài)網(wǎng)頁,從性能上考慮囤躁,偽靜態(tài)功能不但沒有提升網(wǎng)站性能冀痕,反而會降低網(wǎng)站的性能。
3.偽靜態(tài)網(wǎng)頁作用
由于搜索引擎無法正確讀取帶參數(shù)的動態(tài)網(wǎng)頁內(nèi)容狸演,造成網(wǎng)頁中很多具有豐富信息的頁面無法被搜索引擎收錄言蛇,因此才有了偽靜態(tài)技術(shù),它的作用是把動態(tài)網(wǎng)頁URL改成靜態(tài)網(wǎng)頁的URL宵距,雖然同樣是消除了動態(tài)網(wǎng)頁中的參數(shù)腊尚,但是并不需要生成任何網(wǎng)頁,僅僅是改變了網(wǎng)頁地址路徑满哪,找我養(yǎng)的主要目的有兩個婿斥,一是讓搜索引擎收錄網(wǎng)站內(nèi)容劝篷,實現(xiàn)更多的用戶訪問企業(yè)網(wǎng)站內(nèi)容,二是提升用戶訪問體驗民宿,動態(tài)地址帶特殊符號等的URL看起來也不知道看著靜態(tài)網(wǎng)頁地址舒服娇妓。
4.偽靜態(tài)網(wǎng)頁的缺點
動態(tài)網(wǎng)頁偽裝靜態(tài)網(wǎng)頁,雖然可以讓搜索引擎收錄活鹰,并且可以提升用戶訪問體驗哈恰,但偽靜態(tài)網(wǎng)頁并不能提示我那個網(wǎng)站的訪問效率性能,從理論上說還會降低網(wǎng)站的性能志群,沒有動態(tài)轉(zhuǎn)靜態(tài)網(wǎng)頁效率高着绷,但是對于一些并發(fā)不是超大的情況來說,或者是硬件資源充足的情況來說偽靜態(tài)還是一個不錯的實用功能锌云,因為蓬戚,要把動態(tài)網(wǎng)頁真正轉(zhuǎn)成靜態(tài)網(wǎng)頁,不是一朝一夕的事宾抓,需要技術(shù)團隊同力配合才能行子漩。
現(xiàn)在很多的大型網(wǎng)站都采用了動態(tài)網(wǎng)頁生成靜態(tài)網(wǎng)頁的技術(shù),消除動態(tài)網(wǎng)頁中的參數(shù)石洗,使搜索引擎收錄更多的內(nèi)容幢泼,達到優(yōu)化網(wǎng)站的效果。當網(wǎng)站遇到訪問瓶頸時讲衫,如果有技術(shù)力量將動態(tài)網(wǎng)頁轉(zhuǎn)化成靜態(tài)網(wǎng)頁缕棵,那就再好不過了,但是涉兽,有些更新頻率很快的業(yè)務并不適合這么做招驴,或者將動態(tài)轉(zhuǎn)為靜態(tài)有很大難度,這時就可以可考慮設置偽靜態(tài)了枷畏。
5.偽靜態(tài)網(wǎng)頁小結(jié)
利用rewrite技術(shù)將動態(tài)偽裝成靜態(tài)網(wǎng)頁(URL地址改寫)别厘。
便于搜索引擎收錄提升用戶訪問量以及用戶體驗。
訪問性能沒有提升拥诡,并且轉(zhuǎn)為偽靜態(tài)網(wǎng)頁會消耗資源触趴,因此性能反而會下降。
如果為了性能渴肉,就盡可能將動態(tài)網(wǎng)頁轉(zhuǎn)換成真正的靜態(tài)網(wǎng)頁冗懦。
并發(fā)量不是很大或者動態(tài)更新過于頻繁的時候,用rewrite實現(xiàn)偽靜態(tài)也是不錯的仇祭。
偽靜態(tài)網(wǎng)頁的實現(xiàn)過程披蕉,一般是由運營產(chǎn)品提出要求,開發(fā)和運維共同實現(xiàn)的。
四没讲、生產(chǎn)Web架構(gòu)優(yōu)化實戰(zhàn)方案
1.門戶新聞業(yè)務
新聞的特點是一旦發(fā)布完成承冰,幾乎不會再改動網(wǎng)頁內(nèi)容。因此食零,對于新聞業(yè)務內(nèi)容的靜態(tài)化相比較簡單。
第一步:程序要支持發(fā)布動態(tài)內(nèi)功轉(zhuǎn)成靜態(tài)功能寂屏。
第二步:運營編輯人員發(fā)布新聞網(wǎng)頁(內(nèi)容進數(shù)據(jù)庫贰谣,圖片、視頻進入存儲)后迁霎,后臺程序立刻將動態(tài)網(wǎng)頁生成靜態(tài)文件吱抚。
第三部:運維人員通過發(fā)布或事件觸發(fā)把運營編輯生成的靜態(tài)網(wǎng)頁發(fā)布到時間搭建好好的公司緩存集群服務器上,或者把靜態(tài)內(nèi)容同步到購買的全國所有CDN服務器節(jié)點上,然后考廉,再提供給用戶訪問瀏覽秘豹。
2.視頻網(wǎng)站業(yè)務
視頻網(wǎng)站和新聞網(wǎng)站類似,特點都是一旦發(fā)布完成昌粤,幾乎不會再改動網(wǎng)頁內(nèi)容既绕。因此,實現(xiàn)視頻業(yè)務網(wǎng)站高效訪問也很簡單涮坐。
以優(yōu)酷視頻網(wǎng)為例凄贩,用戶在上傳視頻時,需要經(jīng)歷轉(zhuǎn)碼—>審核的過程(大約一個小時)袱讹,然后一些熱點視頻也可能會被提前推送同步到CDN的核心節(jié)點或全國所有CDN服務器節(jié)點疲扎,用戶訪問時才會更快。
3.Blog/BBS/SNS/微博社區(qū)業(yè)務/電商(如淘寶捷雕、京東)
五椒丧、網(wǎng)站流量度量術(shù)語
1.IP(Internet Protocol)
這里指獨立的IP數(shù),獨立IP書是指不同IP地址的計算機訪問網(wǎng)站時被計算的總次數(shù)救巷。獨立IP是衡量網(wǎng)站流量的一個重要指標壶熏。一般一天內(nèi)相同IP地址的客戶端訪問網(wǎng)站頁面只被計算一次,記錄獨立IP的時間可為一天過一個月浦译,目前通用的標準為“一天”久橙。
獨立的IP地址不是很準確,卻是IT技術(shù)人員比較關(guān)心的一個衡量網(wǎng)站的指標管怠。
2.PV(Page View)
中文翻譯為頁面瀏覽淆衷,即頁面瀏覽量或點擊量,不管客戶端是不是相同渤弛,也不管IP是不是相同祝拯,用戶每次訪問一個網(wǎng)站頁面都會被計算一個PV。
用PV衡量網(wǎng)站時,PV數(shù)反映的是瀏覽某網(wǎng)站的頁面數(shù)量佳头,每刷新一次頁面也算一次鹰贵。因此,可以說PV數(shù)與來訪用戶的數(shù)量成正比康嘉,但PV數(shù)并不是真正的頁面來訪者數(shù)量碉输,而是網(wǎng)站被訪問的頁面數(shù)量,因為一個來訪者可能產(chǎn)生多個PV亭珍。
3.UV(Unique Visitor)
UV(獨立訪客)敷钾,同一臺客戶端(PC或移動端)訪問網(wǎng)站被計算為一個訪客,一天內(nèi)相同的客戶端訪問同一個網(wǎng)站只計算一次UV肄梨。UV一般是以客戶端Cookie等技術(shù)作為統(tǒng)計依據(jù)的阻荒,實際統(tǒng)計會有誤差。
考慮到一臺客戶端電腦可能會有多人 使用的情況众羡,因此侨赡,UV(獨立訪客)實際上并不一定是獨立的自然人訪問。
六粱侣、企業(yè)網(wǎng)站對IP羊壹、PV、UV的度量
1.對IP的度量:
分析所有的Web服務器的訪問日志齐婴,對IP地址去重后技術(shù)舶掖,這是IT人員的基本計算手段。
在網(wǎng)站額每一個頁面結(jié)尾尔店,嵌入JS等統(tǒng)計程序代碼眨攘,待用戶加載網(wǎng)頁后,IP即傳給統(tǒng)計IP的服務器嚣州,這種方法一般被第三方統(tǒng)計公司或企業(yè)內(nèi)部開發(fā)日志分析程序時使用鲫售。
用第三方大家比較信任的統(tǒng)計工具例如:谷歌的統(tǒng)計(GA)。
IP的統(tǒng)計方法簡單该肴、易用情竹,因此,成為了多數(shù)網(wǎng)站衡量網(wǎng)站流量的重要指標之一匀哄。
2.對PV的度量:
分析Web服務的訪問日志(需要排除js秦效、css及各種圖片的 日志信息),只計算HTML涎嚼、PHP結(jié)尾等頁面數(shù)量阱州。
在網(wǎng)站的每一個頁面結(jié)尾,嵌入JS等統(tǒng)計程序代碼法梯,待用戶加載網(wǎng)頁后苔货,訪問數(shù)量即傳給統(tǒng)計PV服務器犀概,這種方法一般被第三方公司或企業(yè)內(nèi)部開發(fā)日志分析程序時使用。
用第三方大家比較信任的統(tǒng)計工具例如:谷歌的統(tǒng)計(GA)夜惭。
3.對UV的度量:
通過客戶端HTTP請求報文分析
通過Cookie鑒別
UV的度量相對IP和PV來說姻灶,不但麻煩,而且要開發(fā)比較復雜的程序系統(tǒng)才能得到期望的結(jié)果诈茧,因此产喉,在Linux運維領(lǐng)域大家提及的較少,一般企業(yè)級運營人員可能會關(guān)注網(wǎng)站的UV敢会。