1.1大型網(wǎng)站軟件系統(tǒng)的特點(diǎn)
高并發(fā)怎囚,大流量:需要面對(duì)高并發(fā)用戶,大流量訪問
高可用:系統(tǒng)7*24小時(shí)不間斷服務(wù)
海量數(shù)據(jù):需要存儲(chǔ)抵怎、管理海量數(shù)據(jù)莺债,需要使用大量服務(wù)器
用戶分布廣泛紧憾,網(wǎng)絡(luò)情況復(fù)雜
安全環(huán)境惡劣
需求快速變更到千,發(fā)布頻繁
漸進(jìn)式發(fā)展
1.2大型網(wǎng)站架構(gòu)演化發(fā)展歷程
1.2.1初始階段的網(wǎng)站架構(gòu)
應(yīng)用程序、數(shù)據(jù)庫赴穗、文件等資源都在一個(gè)服務(wù)器上憔四。通常服務(wù)器操作系統(tǒng)用Linux,應(yīng)用程序用PHP開發(fā)般眉,部署在apache上了赵,數(shù)據(jù)庫用MySQL
1.2.2應(yīng)用服務(wù)和數(shù)據(jù)服務(wù)分離
應(yīng)用和數(shù)據(jù)分離后整個(gè)網(wǎng)站使用三臺(tái)服務(wù)器:應(yīng)用服務(wù)器、文件服務(wù)器和數(shù)據(jù)庫服務(wù)器
應(yīng)用服務(wù)器處理大量業(yè)務(wù)邏輯甸赃,CPU要求高柿汛;數(shù)據(jù)庫服務(wù)器快速磁盤檢索和數(shù)據(jù)緩存,硬盤內(nèi)存要求高埠对;文件服務(wù)器存儲(chǔ)大量用戶上傳的文件络断,硬盤要求高
存在問題:用戶逐漸增多,數(shù)據(jù)庫壓力太大導(dǎo)致訪問延遲项玛,影響網(wǎng)站性能和用戶體驗(yàn)
1.2.3使用緩存改善網(wǎng)站性能
網(wǎng)絡(luò)訪問特點(diǎn)符合二八定律貌笨,大部分業(yè)務(wù)訪問集中在一小部分?jǐn)?shù)據(jù)上,把這一小部分?jǐn)?shù)據(jù)緩存在內(nèi)存中襟沮,可以減少數(shù)據(jù)庫壓力锥惋。
網(wǎng)站使用的緩存分兩種:緩存在應(yīng)用服務(wù)器上的本地緩存和緩存在專門的分布式緩存服務(wù)器上的遠(yuǎn)程緩存。本地緩存訪問速度快开伏,緩存數(shù)據(jù)量有限膀跌,遠(yuǎn)程分布式緩存可用集群方式,理論上不受內(nèi)存容量限制
存在問題:?jiǎn)我粦?yīng)用服務(wù)器能處理的請(qǐng)求連接有限固灵,在網(wǎng)站訪問高峰期淹父,應(yīng)用服務(wù)器成為整個(gè)網(wǎng)站的瓶頸。
1.2.4使用應(yīng)用服務(wù)器集群改善網(wǎng)站的并發(fā)處理能力
應(yīng)用服務(wù)器實(shí)現(xiàn)集群是網(wǎng)站可伸縮性架構(gòu)設(shè)計(jì)中較為簡(jiǎn)單成熟的一種怎虫,通過負(fù)載均衡調(diào)度服務(wù)器暑认,將用戶瀏覽器訪問請(qǐng)求分發(fā)到應(yīng)用服務(wù)器集群的任何一臺(tái)服務(wù)器上困介。
1.2.5數(shù)據(jù)庫讀寫分離
網(wǎng)站使用緩存后,絕大部分?jǐn)?shù)據(jù)操作訪問都可以不通過數(shù)據(jù)庫就能完成蘸际,但仍有一部分讀操作和全部寫操作需要訪問數(shù)據(jù)庫座哩,當(dāng)用戶達(dá)到一定規(guī)模,數(shù)據(jù)庫因負(fù)載壓力過高而成為網(wǎng)站瓶頸粮彤。
目前主流數(shù)據(jù)庫提供主從熱備功能根穷,通過配置兩臺(tái)數(shù)據(jù)庫主從關(guān)系,可以將一臺(tái)數(shù)據(jù)庫服務(wù)器數(shù)據(jù)更新同步到另一臺(tái)服務(wù)器导坟。網(wǎng)站利用這一功能屿良,實(shí)現(xiàn)數(shù)據(jù)庫讀寫分離,改善負(fù)載壓力惫周。
應(yīng)用服務(wù)器寫數(shù)據(jù)時(shí)尘惧,訪問主數(shù)據(jù)庫,主數(shù)據(jù)庫通過主從復(fù)制機(jī)制將數(shù)據(jù)更新到從數(shù)據(jù)庫递递,這樣應(yīng)用服務(wù)器讀數(shù)據(jù)就可以通過從數(shù)據(jù)庫獲得數(shù)據(jù)喷橙。
1.2.6使用反向代理和CDN加速網(wǎng)站響應(yīng)
CDN和反向代理的基本原理都是緩存,區(qū)別在于CDN部署在網(wǎng)絡(luò)供應(yīng)商機(jī)房登舞,用戶請(qǐng)求網(wǎng)站服務(wù)時(shí)可以從距離最近的機(jī)房獲取數(shù)據(jù)贰逾;反向代理則部署在網(wǎng)站中心機(jī)房,用戶請(qǐng)求到達(dá)中心機(jī)房后菠秒,先訪問反向代理服務(wù)器疙剑,如果反向代理服務(wù)器緩存著用戶請(qǐng)求的資源,就直接返回給用戶践叠。
1.2.7使用分布式文件系統(tǒng)和分布式數(shù)據(jù)庫系統(tǒng)
分布式數(shù)據(jù)庫是網(wǎng)站數(shù)據(jù)庫拆分的最后手段言缤,只有在單表數(shù)據(jù)規(guī)模非常龐大的時(shí)候才使用。網(wǎng)站常用的數(shù)據(jù)庫拆分手段是業(yè)務(wù)分庫酵熙,將不同業(yè)務(wù)的數(shù)據(jù)庫部署在不同的物理服務(wù)器上轧简。
1.2.8使用NoSQL和搜索引擎
網(wǎng)站需要采用一些非關(guān)系數(shù)據(jù)庫技術(shù)如NoSQL和非數(shù)據(jù)庫查詢技術(shù)如搜索引擎
1.2.9業(yè)務(wù)拆分
大型網(wǎng)站為了應(yīng)對(duì)日益復(fù)雜的業(yè)務(wù)場(chǎng)景,將整個(gè)網(wǎng)站業(yè)務(wù)分成不同的產(chǎn)品線匾二,如大型購物網(wǎng)站將首頁哮独、商鋪、訂單察藐、買家皮璧、賣家等拆分成不同的產(chǎn)品線分歸不同的業(yè)務(wù)團(tuán)隊(duì)負(fù)責(zé)。
應(yīng)用之間通過超鏈接建立關(guān)系分飞,也可以通過消息隊(duì)列進(jìn)行數(shù)據(jù)分發(fā)悴务,最多的還是訪問同一個(gè)數(shù)據(jù)存儲(chǔ)系統(tǒng)來構(gòu)成一個(gè)關(guān)聯(lián)的完整系統(tǒng)。
1.2.10分布式服務(wù)
每一個(gè)應(yīng)用都需要執(zhí)行許多相同的業(yè)務(wù)操作時(shí),如用戶管理讯檐、商品管理等羡疗,可以將這些共用的業(yè)務(wù)提取出來,獨(dú)立部署别洪。由這些可復(fù)用的業(yè)務(wù)連接數(shù)據(jù)庫叨恨,提供共用業(yè)務(wù)服務(wù),而應(yīng)用系統(tǒng)只需要管理用戶界面挖垛,通過分布式服務(wù)調(diào)用公用業(yè)務(wù)服務(wù)完成具體業(yè)務(wù)操作即可痒钝。
1.3大型網(wǎng)站架構(gòu)演化的價(jià)值觀
1.3.1大型網(wǎng)站架構(gòu)技術(shù)的核心價(jià)值是隨網(wǎng)站所靈活應(yīng)對(duì)
1.3.2驅(qū)動(dòng)大型網(wǎng)站技術(shù)發(fā)展的主要力量是網(wǎng)站的業(yè)務(wù)發(fā)展
1.4網(wǎng)站架構(gòu)設(shè)計(jì)誤區(qū)
1.4.1一味追隨大公司的解決方案
1.4.2為了技術(shù)而技術(shù)
1.4.3企圖用技術(shù)解決所有問題
技術(shù)是用來解決業(yè)務(wù)問題的,而業(yè)務(wù)的問題也可以通過業(yè)務(wù)的手段去解決