第一篇? ? ?網(wǎng)站基礎(chǔ)知識(shí)
本篇主要內(nèi)容主要包括網(wǎng)站架構(gòu)的演變、web中涉及的協(xié)議可免、協(xié)議的實(shí)現(xiàn)方法、java中的Servlet以及Tomcat的分析兑燥。
第一章 網(wǎng)站架構(gòu)及其演變過(guò)程
1.1 軟件的三大類(lèi)型
軟件的三大類(lèi)型包括:?jiǎn)螜C(jī)類(lèi)型渣锦、CS類(lèi)型和BS類(lèi)型赋访,其中現(xiàn)在使用最廣的是BS挠将,因?yàn)樗_(kāi)發(fā)簡(jiǎn)單忘渔、使用方便而且功能強(qiáng)大备恤。但BS結(jié)構(gòu)在靈活性和處理效率上都不如CS結(jié)構(gòu)稿饰,所以想QQ等軟件使用的還是CS結(jié)構(gòu)。
如圖
1.2 基礎(chǔ)的結(jié)構(gòu)并不簡(jiǎn)單
前面說(shuō)的BS的結(jié)構(gòu)是最簡(jiǎn)單的結(jié)構(gòu)露泊,但它的底層實(shí)現(xiàn)也并不簡(jiǎn)單喉镰。因?yàn)樗枰ㄟ^(guò)互聯(lián)網(wǎng)傳輸數(shù)據(jù),而互聯(lián)網(wǎng)是一個(gè)錯(cuò)綜復(fù)雜的網(wǎng)絡(luò)惭笑。BS結(jié)構(gòu)網(wǎng)絡(luò)傳輸有兩種參考模型:一種是標(biāo)準(zhǔn)的OSI參考模型侣姆,另外一種是TCP/IP參考模型。
如圖
OSI參考模型共分為7層沉噩,主要用于教學(xué)捺宗,實(shí)際中更多使用的是TCP/IP的4層模型,分別為網(wǎng)絡(luò)接入層川蒙、網(wǎng)際互連層蚜厉、傳輸層和應(yīng)用層。
網(wǎng)站架構(gòu)要解決的兩個(gè)最核心的問(wèn)題:海量數(shù)據(jù)操作問(wèn)題和高并發(fā)問(wèn)題畜眨。
1.3 架構(gòu)演變的起點(diǎn)
從一臺(tái)服務(wù)器到數(shù)據(jù)和應(yīng)用的分離昼牛。
1.4海量數(shù)據(jù)的解決方案
1.4.1 緩存和頁(yè)面靜態(tài)化
數(shù)據(jù)量大直接的解決方案就是使用緩存。使用緩存的方式可以分為通過(guò)程序直接保存到內(nèi)存中和使用緩存框架兩種康聂。程序直接操作主要使用Map贰健,尤其是ConcurrentHashMap(參見(jiàn):http://www.importnew.com/22007.html);常用的緩存框架有Ehcache恬汁、Memcache和Redis等伶椿。緩存使用過(guò)程中最重要的問(wèn)題是什么時(shí)候創(chuàng)建緩存和緩存的失效機(jī)制。
緩存不適用的場(chǎng)景:數(shù)據(jù)變化頻繁蕊连、數(shù)據(jù)實(shí)時(shí)性要求高。
頁(yè)面靜態(tài)化游昼,也可以理解為另外一種形式的緩存甘苍,緩存是將從數(shù)據(jù)庫(kù)獲取到的數(shù)據(jù)保存起來(lái),而頁(yè)面靜態(tài)化是將程序最后生成的頁(yè)面保存起來(lái)烘豌,不但不需要查詢數(shù)據(jù)庫(kù)载庭,而且連應(yīng)用程序處理都省了,所以頁(yè)面靜態(tài)化同時(shí)對(duì)數(shù)據(jù)量大河并發(fā)量高兩大問(wèn)題都有好處。
1.4.2 數(shù)據(jù)庫(kù)優(yōu)化
常用的有表結(jié)構(gòu)優(yōu)化囚聚、SQL語(yǔ)句優(yōu)化靖榕、分區(qū)和分表、索引優(yōu)化顽铸、使用存儲(chǔ)過(guò)程代替直接操作茁计,另外有時(shí)也可以使用冗余。
表結(jié)構(gòu)優(yōu)化
沒(méi)有不變的準(zhǔn)則谓松,需要根據(jù)實(shí)際情況具體處理
SQL語(yǔ)句優(yōu)化
基礎(chǔ)優(yōu)化是語(yǔ)法層面的優(yōu)化星压,更重要的是處理邏輯的優(yōu)化,也需要根據(jù)具體情況進(jìn)行處理鬼譬。
分區(qū)
分區(qū)是將一張表中的數(shù)據(jù)按照一定的規(guī)則分到不同的區(qū)來(lái)保存娜膘,這樣在查詢時(shí)如果數(shù)據(jù)范圍在同一個(gè)區(qū)內(nèi)那么可以只對(duì)一個(gè)區(qū)的數(shù)據(jù)進(jìn)行操作,這樣操作的數(shù)據(jù)量更少优质,速度更快竣贪。
分表
如果一張表中的數(shù)據(jù)可以分為幾種固定不變的類(lèi)型,而且如果同時(shí)對(duì)多種類(lèi)型共同操作的情況不多巩螃,那么都可以通過(guò)分表來(lái)處理演怎。
索引優(yōu)化
索引是一把雙刃劍,它咋提高查詢速度的同時(shí)也降低了增刪改的速度牺六,因?yàn)槊看螖?shù)據(jù)變化都需要更新相應(yīng)的索引颤枪。所以對(duì)哪些字段使用索引、使用什么類(lèi)型的索引都需要仔細(xì)琢磨淑际。
使用存儲(chǔ)過(guò)程代替直接操作
存儲(chǔ)過(guò)程只編譯一次畏纲,所以當(dāng)有操作過(guò)程復(fù)雜而且調(diào)用頻率高的業(yè)務(wù),可以使用存儲(chǔ)過(guò)程代替直接操作春缕。
1.4.3 分離活躍數(shù)據(jù)
通過(guò)將不活躍數(shù)據(jù)分離盗胀,減小活躍數(shù)據(jù)的數(shù)據(jù)量,可以明顯提高查詢效率锄贼。
1.4.4 批量讀取和延遲修改
批量讀取和延遲修改都是通過(guò)減少操作次數(shù)來(lái)提高效率票灰。
批量讀取是將多次查詢合并到一次中進(jìn)行≌纾可以將一個(gè)請(qǐng)求的多次查詢進(jìn)行合并屑迂,也可以將一定時(shí)間范圍內(nèi)的多個(gè)請(qǐng)求的多次查詢合并到一起統(tǒng)一查詢一次數(shù)據(jù)庫(kù)。
延遲修改主要是針對(duì)高并發(fā)而且頻繁修改的數(shù)據(jù)冯键∪桥危可能引起緩存和數(shù)據(jù)庫(kù)的數(shù)據(jù)不一致,所以重要的數(shù)據(jù)需要做特殊處理惫确。
1.4.5 讀寫(xiě)分離
讀寫(xiě)分離本質(zhì)上是對(duì)數(shù)據(jù)庫(kù)進(jìn)行集群手报,將寫(xiě)入庫(kù)作為主庫(kù)蚯舱,讀庫(kù)作為從庫(kù),關(guān)鍵問(wèn)題是數(shù)據(jù)同步問(wèn)題掩蛤。
1.4.6 分布式數(shù)據(jù)庫(kù)
分布式是對(duì)一個(gè)請(qǐng)求的并行處理枉昏,將不同表放到不同的數(shù)據(jù)庫(kù)服務(wù)器上,如果需要?jiǎng)t可以讓多臺(tái)服務(wù)器同時(shí)處理揍鸟,從而提高處理速度兄裂。
1.4.7 NoSQL和Hadoop
NoSQL通過(guò)多個(gè)塊存儲(chǔ)數(shù)據(jù)的特點(diǎn),其操作大數(shù)據(jù)的速度也非瞅谀叮快懦窘。
Hadoop是將同一個(gè)表中的數(shù)據(jù)分成多塊保存到多個(gè)節(jié)點(diǎn)(分布式),而且每一塊數(shù)據(jù)都有多個(gè)節(jié)點(diǎn)保存(集群)稚配,保證了效率和數(shù)據(jù)完整性畅涂。
1.5 高并發(fā)的解決方案
1.5.1 應(yīng)用和靜態(tài)資源分離
靜態(tài)資源因?yàn)闆](méi)有狀態(tài),所以分離簡(jiǎn)單道川,一般會(huì)使用專(zhuān)門(mén)的域名去訪問(wèn)午衰。
1.5.2 頁(yè)面緩存
頁(yè)面緩存是將應(yīng)用生成的頁(yè)面緩存起來(lái),這樣就不需要每次都重新生成頁(yè)面冒萄,節(jié)省CPU資源臊岸。頁(yè)面緩存的默認(rèn)失效機(jī)制一般是按緩存時(shí)間處理的,也可以手動(dòng)讓相應(yīng)的緩存失效尊流。
使用頁(yè)面緩存和AJAX可以兼顧效率和動(dòng)態(tài)數(shù)據(jù)實(shí)時(shí)刷新帅戒。
1.5.3 集群與分布式
集群式每臺(tái)服務(wù)器都有相同的功能,處理請(qǐng)求時(shí)調(diào)用哪臺(tái)服務(wù)器都可以崖技,主要起分流的作用逻住;分布式是將不同的業(yè)務(wù)放到不同的服務(wù)器中,處理一個(gè)請(qǐng)求需要用到多臺(tái)服務(wù)器迎献,這樣可以提高一個(gè)請(qǐng)求的處理速度瞎访。
集群兩中類(lèi)型:靜態(tài)資源集群和應(yīng)用程序集群。問(wèn)題主要是session共享吁恍。
1.5.4 反向代理
反向代理是指客戶直接訪問(wèn)的服務(wù)器并不真正提供服務(wù)扒秸,它從其他服務(wù)器獲取資源后將結(jié)果返回給用戶。
三個(gè)作用:
1冀瓦、可以作為前端服務(wù)器跟實(shí)際處理請(qǐng)求的服務(wù)器集成
2伴奥、可以用作負(fù)載均衡
3、轉(zhuǎn)發(fā)請(qǐng)求翼闽。
1.5.5 CDN
CDN的服務(wù)器是分布在全國(guó)各地的拾徙,當(dāng)接收到請(qǐng)求后會(huì)將請(qǐng)求分配到最合適的CDN服務(wù)器節(jié)點(diǎn)獲取數(shù)據(jù)。
CDN分配請(qǐng)求的方式比較特殊肄程,使用專(zhuān)門(mén)的CDN域名解析服務(wù)器在解析的是候就分配好的锣吼,一般是在IPS那里使用CNAME將域名解析到一個(gè)特定域名,然后再將解析到的那個(gè)域名用專(zhuān)門(mén)的CDN服務(wù)器解析到相應(yīng)的CDN節(jié)點(diǎn)蓝厌。
1.6 底層的優(yōu)化
優(yōu)化網(wǎng)絡(luò)傳輸i協(xié)議玄叠,比如Google的quic、Spdy等拓提,還有HTTP/2读恃。