三苛聘、網(wǎng)站初級架構(gòu)
一般網(wǎng)站,剛開始的做法忠聚,是三臺服務(wù)器设哗,一臺部署應(yīng)用,一臺部署數(shù)據(jù)庫两蟀,一臺部署NFS文件系統(tǒng)网梢。
這是前幾年比較傳統(tǒng)的做法,之前見到一個網(wǎng)站10萬多會員赂毯,垂直服裝設(shè)計門戶战虏,N多圖片拣宰。使用了一臺服務(wù)器部署了應(yīng)用涌萤,數(shù)據(jù)庫以及圖片存儲驶兜。出現(xiàn)了很多性能問題否纬。
如下圖:
但是翔冀,目前主流的網(wǎng)站架構(gòu)已經(jīng)發(fā)生了翻天覆地的變化侍咱。一般都會采用集群的方式舍悯,進行高可用設(shè)計戒祠。至少是下面這個樣子弥臼。
(1) 使用集群對應(yīng)用服務(wù)器進行冗余绿渣,實現(xiàn)高可用朝群;(負(fù)載均衡設(shè)備可與應(yīng)用一塊部署)
使用數(shù)據(jù)庫主備模式,實現(xiàn)數(shù)據(jù)備份和高可用中符;
四姜胖、系統(tǒng)容量預(yù)估
預(yù)估步驟:
- 注冊用戶數(shù)-日均UV量-每日的PV量-每天的并發(fā)量;
- 峰值預(yù)估:平常量的2~3倍淀散;
- 根據(jù)并發(fā)量(并發(fā)右莱,事務(wù)數(shù)),存儲容量計算系統(tǒng)容量档插。
客戶需求:3~5年用戶數(shù)達(dá)到1000萬注冊用戶隧出;
每秒并發(fā)數(shù)預(yù)估:
- 每天的UV為200萬(二八原則);
- 每日每天點擊瀏覽30次阀捅;
- PV量:200*30=6000萬胀瞪;
- 集中訪問量:240.2=4.8小時會有6000萬0.8=4800萬(二八原則);
- 每分并發(fā)量:4.8*60=288分鐘饲鄙,每分鐘訪問4800/288=16.7萬(約等于)凄诞;
- 每秒并發(fā)量:16.7萬/60=2780(約等于);
- 假設(shè):高峰期為平常值的三倍忍级,則每秒的并發(fā)數(shù)可以達(dá)到8340次帆谍。
- 1毫秒=1.3次訪問;
沒好好學(xué)數(shù)學(xué)后悔了吧轴咱?Q打(不知道以上算是否有錯誤,呵呵~~)
服務(wù)器預(yù)估:(以tomcat服務(wù)器舉例)
- 按一臺web服務(wù)器朴肺,支持每秒300個并發(fā)計算窖剑。平常需要10臺服務(wù)器(約等于);[tomcat默認(rèn)配置是150]
- 高峰期:需要30臺服務(wù)器戈稿;
容量預(yù)估:70/90原則
系統(tǒng)CPU一般維持在70%左右的水平西土,高峰期達(dá)到90%的水平,是不浪費資源鞍盗,并比較穩(wěn)定的需了。內(nèi)存跳昼,IO類似。
以上預(yù)估僅供參考肋乍,因為服務(wù)器配置鹅颊,業(yè)務(wù)邏輯復(fù)雜度等都有影響。在此CPU墓造,硬盤挪略,網(wǎng)絡(luò)等不再進行評估。
五滔岳、網(wǎng)站架構(gòu)分析
根據(jù)以上預(yù)估,有幾個問題:
- 需要部署大量的服務(wù)器挽牢,高峰期計算谱煤,可能要部署30臺Web服務(wù)器。并且這三十臺服務(wù)器禽拔,只有秒殺刘离,活動時才會用到,存在大量的浪費睹栖。
- 所有的應(yīng)用部署在同一臺服務(wù)器硫惕,應(yīng)用之間耦合嚴(yán)重。需要進行垂直切分和水平切分野来。
- 大量應(yīng)用存在冗余代碼
- 服務(wù)器SESSION同步耗費大量內(nèi)存和網(wǎng)絡(luò)帶寬
- 數(shù)據(jù)需要頻繁訪問數(shù)據(jù)庫恼除,數(shù)據(jù)庫訪問壓力巨大。
大型網(wǎng)站一般需要做以下架構(gòu)優(yōu)化(優(yōu)化是架構(gòu)設(shè)計時曼氛,就要考慮的豁辉,一般從架構(gòu)/代碼級別解決,調(diào)優(yōu)主要是簡單參數(shù)的調(diào)整舀患,比如JVM調(diào)優(yōu)徽级;如果調(diào)優(yōu)涉及大量代碼改造,就不是調(diào)優(yōu)了聊浅,屬于重構(gòu)):
- 業(yè)務(wù)拆分
- 應(yīng)用集群部署(分布式部署餐抢,集群部署和負(fù)載均衡)
- 多級緩存
- 單點登錄(分布式Session)
- 數(shù)據(jù)庫集群(讀寫分離,分庫分表)
- 服務(wù)化
- 消息隊列
- 其他技術(shù)
六低匙、網(wǎng)站架構(gòu)優(yōu)化
6.1業(yè)務(wù)拆分
根據(jù)業(yè)務(wù)屬性進行垂直切分旷痕,劃分為產(chǎn)品子系統(tǒng),購物子系統(tǒng)顽冶,支付子系統(tǒng)苦蒿,評論子系統(tǒng),客服子系統(tǒng)渗稍,接口子系統(tǒng)(對接如進銷存佩迟,短信等外部系統(tǒng))团滥。
根據(jù)業(yè)務(wù)子系統(tǒng)進行等級定義,可分為核心系統(tǒng)和非核心系統(tǒng)报强。核心系統(tǒng):產(chǎn)品子系統(tǒng)灸姊,購物子系統(tǒng),支付子系統(tǒng)秉溉;非核心:評論子系統(tǒng)力惯,客服子系統(tǒng),接口子系統(tǒng)召嘶。
業(yè)務(wù)拆分作用:提升為子系統(tǒng)可由專門的團隊和部門負(fù)責(zé)父晶,專業(yè)的人做專業(yè)的事,解決模塊之間耦合以及擴展性問題弄跌;每個子系統(tǒng)單獨部署甲喝,避免集中部署導(dǎo)致一個應(yīng)用掛了,全部應(yīng)用不可用的問題铛只。
等級定義作用:用于流量突發(fā)時埠胖,對關(guān)鍵應(yīng)用進行保護,實現(xiàn)優(yōu)雅降級淳玩;保護關(guān)鍵應(yīng)用不受到影響直撤。
拆分后的架構(gòu)圖:
參考部署方案2
- 如上圖每個應(yīng)用單獨部署
- 核心系統(tǒng)和非核心系統(tǒng)組合部署
6.2應(yīng)用集群部署(分布式,集群蜕着,負(fù)載均衡)
分布式部署:將業(yè)務(wù)拆分后的應(yīng)用單獨部署谋竖,應(yīng)用直接通過RPC進行遠(yuǎn)程通信;
集群部署:電商網(wǎng)站的高可用要求承匣,每個應(yīng)用至少部署兩臺服務(wù)器進行集群部署圈盔;
負(fù)載均衡:是高可用系統(tǒng)必須的,一般應(yīng)用通過負(fù)載均衡實現(xiàn)高可用悄雅,分布式服務(wù)通過內(nèi)置的負(fù)載均衡實現(xiàn)高可用驱敲,關(guān)系型數(shù)據(jù)庫通過主備方式實現(xiàn)高可用。
集群部署后架構(gòu)圖:
6.3 多級緩存
緩存按照存放的位置一般可分為兩類本地緩存和分布式緩存宽闲。本案例采用二級緩存的方式众眨,進行緩存的設(shè)計。一級緩存為本地緩存容诬,二級緩存為分布式緩存娩梨。(還有頁面緩存,片段緩存等览徒,那是更細(xì)粒度的劃分)
一級緩存狈定,緩存數(shù)據(jù)字典,和常用熱點數(shù)據(jù)等基本不可變/有規(guī)則變化的信息,二級緩存緩存需要的所有緩存纽什。當(dāng)一級緩存過期或不可用時措嵌,訪問二級緩存的數(shù)據(jù)。如果二級緩存也沒有芦缰,則訪問數(shù)據(jù)庫企巢。
緩存的比例,一般1:4让蕾,即可考慮使用緩存浪规。(理論上是1:2即可)。
根據(jù)業(yè)務(wù)特性可使用以下緩存過期策略:
- 緩存自動過期探孝;
- 緩存觸發(fā)過期笋婿;
6.4單點登錄(分布式Session)
系統(tǒng)分割為多個子系統(tǒng),獨立部署后顿颅,不可避免的會遇到會話管理的問題缸濒。一般可采用Session同步,Cookies元镀,分布式Session方式。電商網(wǎng)站一般采用分布式Session實現(xiàn)霎桅。
再進一步可以根據(jù)分布式Session栖疑,建立完善的單點登錄或賬戶管理系統(tǒng)。
流程說明
- 用戶第一次登錄時滔驶,將會話信息(用戶Id和用戶信息)遇革,比如以用戶Id為Key,寫入分布式Session揭糕;
- 用戶再次登錄時萝快,獲取分布式Session,是否有會話信息著角,如果沒有則調(diào)到登錄頁揪漩;
- 一般采用Cache中間件實現(xiàn),建議使用Redis吏口,因此它有持久化功能奄容,方便分布式Session宕機后,可以從持久化存儲中加載會話信息产徊;
- 存入會話時,可以設(shè)置會話保持的時間舟铜,比如15分鐘戈盈,超過后自動超時;
結(jié)合Cache中間件谆刨,實現(xiàn)的分布式Session塘娶,可以很好的模擬Session會話归斤。
6.5數(shù)據(jù)庫集群(讀寫分離,分庫分表)
大型網(wǎng)站需要存儲海量的數(shù)據(jù)血柳,為達(dá)到海量數(shù)據(jù)存儲官册,高可用,高性能一般采用冗余的方式進行系統(tǒng)設(shè)計难捌。一般有兩種方式讀寫分離和分庫分表膝宁。
讀寫分離:一般解決讀比例遠(yuǎn)大于寫比例的場景,可采用一主一備根吁,一主多備或多主多備方式员淫。
本案例在業(yè)務(wù)拆分的基礎(chǔ)上,結(jié)合分庫分表和讀寫分離击敌。如下圖:
- 業(yè)務(wù)拆分后:每個子系統(tǒng)需要單獨的庫介返;
- 如果單獨的庫太大,可以根據(jù)業(yè)務(wù)特性沃斤,進行再次分庫圣蝎,比如商品分類庫,產(chǎn)品庫衡瓶;
- 分庫后徘公,如果表中有數(shù)據(jù)量很大的,則進行分表哮针,一般可以按照Id关面,時間等進行分表;(高級的用法是一致性Hash)
- 在分庫十厢,分表的基礎(chǔ)上等太,進行讀寫分離包颁;
相關(guān)中間件可參考Cobar(阿里,目前已不在維護)漠其,TDDL(阿里),Atlas(奇虎360),MyCat(在Cobar基礎(chǔ)上潜沦,國內(nèi)很多牛人,號稱國內(nèi)第一開源項目)。
分庫分表后序列的問題,JOIN握童,事務(wù)的問題红伦,會在分庫分表主題分享中膨桥,介紹。
6.6服務(wù)化
將多個子系統(tǒng)公用的功能/模塊蕴掏,進行抽取挽荡,作為公用服務(wù)使用定拟。比如本案例的會員子系統(tǒng)就可以抽取為公用的服務(wù)。
6.7消息隊列
消息隊列可以解決子系統(tǒng)/模塊之間的耦合需曾,實現(xiàn)異步车份,高可用出爹,高性能的系統(tǒng)梢为。是分布式系統(tǒng)的標(biāo)準(zhǔn)配置肴沫。本案例中孽文,消息隊列主要應(yīng)用在購物郁副,配送環(huán)節(jié)减牺。
- 用戶下單后,寫入消息隊列存谎,后直接返回客戶端拔疚;
- 庫存子系統(tǒng):讀取消息隊列信息既荚,完成減庫存;
- 配送子系統(tǒng):讀取消息隊列信息恰聘,進行配送晴叨;
目前使用較多的MQ有Active MQ,Rabbit MQ,Zero MQ凿宾,MS MQ等,需要根據(jù)具體的業(yè)務(wù)場景進行選擇兼蕊。建議可以研究下Rabbit MQ初厚。
6.8其他架構(gòu)(技術(shù))
除了以上介紹的業(yè)務(wù)拆分,應(yīng)用集群孙技,多級緩存产禾,單點登錄,數(shù)據(jù)庫集群牵啦,服務(wù)化亚情,消息隊列外。還有CDN蕾久,反向代理势似,分布式文件系統(tǒng)拌夏,大數(shù)據(jù)處理等系統(tǒng)僧著。
此處不詳細(xì)介紹,大家可以問度娘/Google障簿,有機會的話也可以分享給大家盹愚。
七、架構(gòu)總結(jié)
以上是本次分享的架構(gòu)總結(jié)站故,其中細(xì)節(jié)可參考前面分享的內(nèi)容皆怕。其中還有很多可以優(yōu)化和細(xì)化的地方毅舆,因為是案例分享,主要針對重要部分做了介紹愈腾,工作中需要大家根據(jù)具體的業(yè)務(wù)場景進行架構(gòu)設(shè)計憋活。
以上是電商網(wǎng)站架構(gòu)案例的分享一共有三篇,從電商網(wǎng)站的需求虱黄,到單機架構(gòu)悦即,逐步演變?yōu)槌S玫模晒﹨⒖嫉姆植际郊軜?gòu)的原型橱乱。除具備功能需求外辜梳,還具備一定的高性能,高可用泳叠,可伸縮作瞄,可擴展等非功能質(zhì)量需求(架構(gòu)目標(biāo))。