本文為讀《大型網(wǎng)站技術(shù)架構(gòu)-核心原理與案例分析》(作者李智慧)的筆記,摘抄底挫。
一、傳統(tǒng)企業(yè)應(yīng)用系統(tǒng)與互聯(lián)網(wǎng)應(yīng)用系統(tǒng)的區(qū)別
- 高并發(fā)、大流量
- 高可用
- 需要保證應(yīng)用7X24小時都可以穩(wěn)定運行
- 海量數(shù)據(jù)
- 用戶分部廣泛鹰霍,網(wǎng)絡(luò)情況復(fù)雜
- 國內(nèi)各個運營商網(wǎng)絡(luò)互通問題
- 安全環(huán)境惡劣
- 需求快速變更,且發(fā)布頻繁
- 漸進式發(fā)展
- 與傳統(tǒng)軟件產(chǎn)品或企業(yè)應(yīng)用系統(tǒng)一開始就規(guī)劃好全部的功能和非功能需求不同茵乱,幾乎所有的互聯(lián)網(wǎng)網(wǎng)站都是從一個小網(wǎng)站開始茂洒,漸進地發(fā)展起來的。
二瓶竭、大型網(wǎng)站架構(gòu)演化發(fā)展歷程
- 初始網(wǎng)站架構(gòu)
-
因訪問量很小督勺,只需要一臺服務(wù)器渠羞。
- 應(yīng)用服務(wù)和數(shù)據(jù)服務(wù)分離
分離后整個網(wǎng)站使用三臺服務(wù)器:應(yīng)用服務(wù)器、文件服務(wù)器和數(shù)據(jù)庫服務(wù)器智哀。
-
服務(wù)器對硬件資源要求各不相同
- 應(yīng)用服務(wù)器需要處理大量的業(yè)務(wù)邏輯堵未,因此需要更快更強大的CPU
- 數(shù)據(jù)庫服務(wù)器需要快速磁盤檢索和數(shù)據(jù)緩存,因此需要更快的硬盤和更大的內(nèi)存
- 文件服務(wù)器需要存儲大量用戶上傳的文件盏触,因此需要更大的硬盤
- 使用緩存改善網(wǎng)站性能
網(wǎng)站的訪問特點遵循二八定律:80%的業(yè)務(wù)訪問集中在20%的數(shù)據(jù)上渗蟹。因此可以把這20%的熱點數(shù)據(jù)放到緩存中
-
網(wǎng)站的緩存分為兩種
- 本地緩存(緩存在應(yīng)用服務(wù)器本地)
- 遠程緩存(緩存在專門應(yīng)用與緩存的分布式緩存服務(wù)器上)
- 使用應(yīng)用服務(wù)器集群改善網(wǎng)站的并發(fā)處理能力
給應(yīng)用增加一臺服務(wù)器分擔(dān)原有服務(wù)器的訪問及存儲壓力比更換一臺更強大的服務(wù)器更有效。并且還實現(xiàn)了系統(tǒng)的可伸縮性赞辩。以后當(dāng)應(yīng)用有更大的壓力時可以繼續(xù)增加服務(wù)器雌芽。
-
注意此時需要添加一臺負載均衡調(diào)度服務(wù)器
- 數(shù)據(jù)庫讀寫分離
-
雖然使用了緩存,但是還會有緩存不命中及緩存過期的情況辨嗽,并且全部的寫操作都需要訪問數(shù)據(jù)庫世落。這時數(shù)據(jù)庫成為了網(wǎng)站的性能瓶頸。
此時可以利用數(shù)據(jù)庫提供的主從熱備功能糟需,實現(xiàn)數(shù)據(jù)庫的讀寫分離屉佳,從而改善數(shù)據(jù)庫負載壓力。
應(yīng)用在寫數(shù)據(jù)時訪問主數(shù)據(jù)庫洲押,通過從數(shù)據(jù)庫獲得數(shù)據(jù)
(此功能可以使用spring aop及相關(guān)的中間件實現(xiàn))武花。[圖片上傳失敗...(image-8e9206-1535611615069)]
- 使用反向代理和CDN加速網(wǎng)站響應(yīng)
-
CDN和反向代理的基本原理都是緩存,區(qū)別在于CDN部署在網(wǎng)絡(luò)提供商的機房杈帐,使用戶在請求網(wǎng)站服務(wù)時体箕,可以從距離自己最近的網(wǎng)絡(luò)提供商機房獲取數(shù)據(jù);而反向代理則部署在網(wǎng)站的中心機房挑童,當(dāng)用戶請求到達中心機房后累铅,首先訪問的服務(wù)器是反向代理服務(wù)器,如果反向代理服務(wù)器中緩存著用戶請求的資源站叼,就將其直接返回給用戶娃兽。
- 使用分布式文件系統(tǒng)和分布式數(shù)據(jù)庫系統(tǒng)
- 分布式數(shù)據(jù)庫是網(wǎng)站數(shù)據(jù)庫拆分的最后手段,只有在單表數(shù)據(jù)規(guī)模非常龐大的時候才使用尽楔。不到不得已時,網(wǎng)站更常用的數(shù)據(jù)庫拆分手段是業(yè)務(wù)分庫翔试,將不同業(yè)務(wù)的數(shù)據(jù)庫部署在不同的物理服務(wù)器上复旬。
- 使用NoSQL和搜索引擎
- 隨著網(wǎng)站業(yè)務(wù)越來越復(fù)雜,對數(shù)據(jù)存儲和檢索的需求也越來越復(fù)雜驹碍,網(wǎng)站需要采用一些非關(guān)系數(shù)據(jù)庫技術(shù):如NoSQL和非數(shù)據(jù)庫查詢技術(shù)如:搜索引擎
- 應(yīng)用拆分
-
通過將不同的業(yè)務(wù)拆分為不同的產(chǎn)品線壁涎,另每條產(chǎn)品線獨立開發(fā)及部署凡恍。
10)分布式服務(wù)
- 將共用的業(yè)務(wù)提取怔球,由A、B竟坛、C闽巩。。担汤。應(yīng)用訪問共用業(yè)務(wù)涎跨,由共用業(yè)務(wù)訪問數(shù)據(jù)庫,減少數(shù)據(jù)庫連接資源隅很。
- 根據(jù)業(yè)務(wù)拆分后,獨立開發(fā)及部署