一宠互、大型網(wǎng)站系統(tǒng)的特點
高并發(fā)椭坚,大流量:需要面對高并發(fā)用戶予跌,大流量訪問;
高可用:系統(tǒng)24小時不間斷的提供服務(wù)善茎;
海量數(shù)據(jù):需要存儲烁焙、管理海量的數(shù)據(jù)骄蝇,需要使用大量的服務(wù)器九火;
用戶分布廣泛岔激,網(wǎng)絡(luò)情況復(fù)雜:很多大型網(wǎng)站都是為全球用戶服務(wù),用戶的分布范圍廣泛跨细,各地網(wǎng)絡(luò)情況差異大鹦倚;
安全環(huán)境惡劣:互聯(lián)網(wǎng)的開放性,導(dǎo)致網(wǎng)站更容易受黑客的攻擊冀惭;
需求快速變更震叙,發(fā)布頻繁:相比傳統(tǒng)軟件,互聯(lián)網(wǎng)產(chǎn)品為了快速適應(yīng)市場散休,滿足用戶的需求媒楼,產(chǎn)品發(fā)布的頻率是極高的;
漸進式發(fā)展:與傳統(tǒng)行業(yè)軟件不同戚丸,互聯(lián)網(wǎng)產(chǎn)品不是事先就規(guī)劃好了整個產(chǎn)品的全部功能划址,幾乎每個大型互聯(lián)網(wǎng)網(wǎng)站都是從一個小網(wǎng)站,慢慢根據(jù)市場和用戶的改變而慢慢漸進發(fā)展成大型網(wǎng)站的限府;
二夺颤、大型網(wǎng)站架構(gòu)發(fā)展歷程
大型網(wǎng)站的技術(shù)挑戰(zhàn)主要來自三個方面:龐大的用戶體系,高并發(fā)的訪問以及海量數(shù)據(jù)的存儲管理胁勺∈览剑基于這三點,我們就來看看署穗,整個架構(gòu)設(shè)計方面是如何演變的寥裂。
初始階段:這個階段一般網(wǎng)站用戶量也不多嵌洼,訪問量都不大,數(shù)據(jù)量也不多封恰,因此一般一臺服務(wù)器就能搞定麻养,應(yīng)用程序,數(shù)據(jù)庫和文件都可以部署在一臺服務(wù)器上诺舔,架構(gòu)圖如下:
應(yīng)用服務(wù)和數(shù)據(jù)服務(wù)分離階段:隨著用戶數(shù)量的增加鳖昌,越來越多的用戶訪問導(dǎo)致性能越來越差,數(shù)據(jù)也越來越多導(dǎo)致存儲空間不足混萝,此時我們就需要考慮將應(yīng)用和數(shù)據(jù)分離遗遵,此時網(wǎng)站需要3臺服務(wù)器:應(yīng)用服務(wù)器+數(shù)據(jù)庫服務(wù)器+文件服務(wù)器,架構(gòu)設(shè)計如下圖:
使用緩存改善性能階段:隨著數(shù)據(jù)庫壓力越來越大逸嘀,我們需要考慮從數(shù)據(jù)上優(yōu)化性能车要,大家都知道80%的業(yè)務(wù)訪問集中在20%的數(shù)據(jù)上,既然大部分業(yè)務(wù)集中訪問這少部分數(shù)據(jù)崭倘,那為何我們不考慮把這部分數(shù)據(jù)緩存在內(nèi)存中呢翼岁,不就可以減小對數(shù)據(jù)庫訪問的壓力了嘛;
緩存又分為2種司光,一種是本地緩存(本地緩存是基于內(nèi)存的琅坡,因此數(shù)據(jù)量有限,但是訪問速度快)残家,另一種是遠程緩存(一些中間件緩存服務(wù)器例如redis榆俺,這部分數(shù)據(jù)理論上不限容量,而且可以做成集群模式)坞淮。
應(yīng)用服務(wù)器集群優(yōu)化網(wǎng)站并發(fā)能力階段:當用戶越來越多時茴晋,對網(wǎng)站的訪問量也越來越多,應(yīng)用服務(wù)器處理請求越來越慢回窘,此時我們可以考慮將應(yīng)用服務(wù)器做成集群模式部署诺擅,再通過負載均衡調(diào)度器,將用戶的請求分發(fā)給集群上不同的應(yīng)用服務(wù)器啡直。
數(shù)據(jù)庫讀寫分離階段:網(wǎng)站在使用了緩存之后烁涌,使部分數(shù)據(jù)可以不通過數(shù)據(jù)庫就能完成,但是對于數(shù)據(jù)庫的修改操作酒觅,還是需要訪問數(shù)據(jù)庫的撮执,這個時候,數(shù)據(jù)庫的負載壓力過高舷丹,能為網(wǎng)站的性能瓶頸抒钱,此時我們就要考慮數(shù)據(jù)庫的讀寫分離了,數(shù)據(jù)庫的讀寫分離是建立在主從熱備的基礎(chǔ)上的,基本目前大多數(shù)主流數(shù)據(jù)庫都支持主從熱備继效,通過配置兩臺或者多臺數(shù)據(jù)庫的主從關(guān)系(1主1從,1主多從装获,多主多從)瑞信,實現(xiàn)數(shù)據(jù)的讀(從庫)寫(主庫)分離,主庫主動將數(shù)據(jù)同步到從庫穴豫。
向代理和CDN加速網(wǎng)站響應(yīng)階段:為了加快網(wǎng)站的訪問速度凡简,我們主要考慮的手段為CDN和反向代理,CDN是部署在網(wǎng)絡(luò)提供商的機房精肃,用戶在訪問時秤涩,可以從距離自己最近的網(wǎng)絡(luò)提供商機房獲取數(shù)據(jù);反向代理是部署在網(wǎng)站自己的中心機房司抱,當用戶請求到達機房時筐眷,優(yōu)先訪問的服務(wù)器是反向代理服務(wù)器,如果反向代理中緩存了用戶請求的資源习柠,那么就直接返回給用戶匀谣,加快了響應(yīng)的速度,也減輕了后端負載的壓力资溃。
分布式文件系統(tǒng)和分布式數(shù)據(jù)庫系統(tǒng)階段:當讀寫分離之后如果還不能滿足網(wǎng)站的需求武翎,那就只能考慮最后的手段了:分布式數(shù)據(jù)庫,網(wǎng)站常用的數(shù)據(jù)庫拆分手段是業(yè)務(wù)分庫溶锭,將不同的業(yè)務(wù)數(shù)據(jù)庫部署在不同的物理機上宝恶。
NoSQL和搜索引擎階段:隨著網(wǎng)站業(yè)務(wù)越來越復(fù)雜,對數(shù)據(jù)的檢索和存儲的需求也越來越復(fù)雜趴捅,網(wǎng)站需要采用一些非關(guān)系型數(shù)據(jù)庫(NoSQL)和非數(shù)據(jù)庫查詢(搜索引擎)技術(shù)垫毙。
業(yè)務(wù)拆分階段:分而治之思想,將整個網(wǎng)站業(yè)務(wù)劃分為不同的產(chǎn)品線驻售,根據(jù)不同的產(chǎn)品線劃分將網(wǎng)站拆成不同的應(yīng)用露久,每個應(yīng)用獨立部署維護如一個電商網(wǎng)站可以分為:首頁,訂單欺栗,商品毫痕,活動,優(yōu)惠卷迟几,個人中心消请,購物車等等多個應(yīng)用,應(yīng)用之間可以通過消息隊列來傳遞數(shù)據(jù)类腮。
分布式服務(wù)階段:隨著業(yè)務(wù)復(fù)雜度提升臊泰,我們會發(fā)現(xiàn)很多系統(tǒng)之間有著共同的業(yè)務(wù),我們可以把這部分業(yè)務(wù)抽取出來蚜枢,做成一個共通的基礎(chǔ)服務(wù)缸逃。
三针饥、網(wǎng)站架構(gòu)設(shè)計的誤區(qū)
一味追求大公司的解決方案:大公司的架構(gòu)和成功案例當然值得借鑒,但是不能盲從需频;
為了技術(shù)而技術(shù):技術(shù)是為業(yè)務(wù)而存在的丁眼,在技術(shù)選型和架構(gòu)設(shè)計中一定要結(jié)合具體業(yè)務(wù),脫離業(yè)務(wù)的架構(gòu)毫無意義昭殉;
企圖用技術(shù)解決所有問題:技術(shù)是用來解決業(yè)務(wù)問題的苞七,而業(yè)務(wù)本身的問題,是可以通過業(yè)務(wù)去解決挪丢,而沒有必要企圖用技術(shù)是解決蹂风;
四、總結(jié)
設(shè)計網(wǎng)站架構(gòu)時一定要從小開始乾蓬,架構(gòu)隨業(yè)務(wù)演變而演變惠啄,切記不要在業(yè)務(wù)還是0的時候去追求1的架構(gòu)設(shè)計,那樣的架構(gòu)只會舍本逐末巢块,得不償失礁阁;
參考 :
https://blog.csdn.net/blankhang/article/details/79346216