淘寶服務(wù)端高并發(fā)分布式架構(gòu)演進(jìn)之路

1 . 概述

本文以淘寶作為例子扔罪,介紹從一百個并發(fā)到千萬級并發(fā)情況下服務(wù)端的架構(gòu)的演進(jìn)過程始腾,同時列舉出每個演進(jìn)階段會遇到的相關(guān)技術(shù)娇掏,讓大家對架構(gòu)的演進(jìn)有一個整體的認(rèn)知呕寝,文章最后匯總了一些架構(gòu)設(shè)計的原則。

2. 基本概念

在介紹架構(gòu)之前婴梧,為了避免部分讀者對架構(gòu)設(shè)計中的一些概念不了解下梢,下面對幾個最基礎(chǔ)的概念進(jìn)行介紹:

分布式系統(tǒng)中的多個模塊在不同服務(wù)器上部署,即可稱為分布式系統(tǒng)塞蹭,如Tomcat和數(shù)據(jù)庫分別部署在不同的服務(wù)器上孽江,或兩個相同功能的Tomcat分別部署在不同服務(wù)器上高可用系統(tǒng)中部分節(jié)點失效時,其他節(jié)點能夠接替它繼續(xù)提供服務(wù)浮还,則可認(rèn)為系統(tǒng)具有高可用性集群一個特定領(lǐng)域的軟件部署在多臺服務(wù)器上并作為一個整體提供一類服務(wù)竟坛,這個整體稱為集群。如Zookeeper中的Master和Slave分別部署在多臺服務(wù)器上钧舌,共同組成一個整體提供集中配置服務(wù)担汤。在常見的集群中,客戶端往往能夠連接任意一個節(jié)點獲得服務(wù)洼冻,并且當(dāng)集群中一個節(jié)點掉線時崭歧,其他節(jié)點往往能夠自動的接替它繼續(xù)提供服務(wù),這時候說明集群具有高可用性負(fù)載均衡請求發(fā)送到系統(tǒng)時撞牢,通過某些方式把請求均勻分發(fā)到多個節(jié)點上率碾,使系統(tǒng)中每個節(jié)點能夠均勻的處理請求負(fù)載,則可認(rèn)為系統(tǒng)是負(fù)載均衡的正向代理和反向代理系統(tǒng)內(nèi)部要訪問外部網(wǎng)絡(luò)時屋彪,統(tǒng)一通過一個代理服務(wù)器把請求轉(zhuǎn)發(fā)出去所宰,在外部網(wǎng)絡(luò)看來就是代理服務(wù)器發(fā)起的訪問,此時代理服務(wù)器實現(xiàn)的是正向代理畜挥;當(dāng)外部請求進(jìn)入系統(tǒng)時仔粥,代理服務(wù)器把該請求轉(zhuǎn)發(fā)到系統(tǒng)中的某臺服務(wù)器上,對外部請求來說蟹但,與之交互的只有代理服務(wù)器躯泰,此時代理服務(wù)器實現(xiàn)的是反向代理。簡單來說华糖,正向代理是代理服務(wù)器代替系統(tǒng)內(nèi)部來訪問外部網(wǎng)絡(luò)的過程麦向,反向代理是外部請求訪問系統(tǒng)時通過代理服務(wù)器轉(zhuǎn)發(fā)到內(nèi)部服務(wù)器的過程。

3. 架構(gòu)演進(jìn)

3.1 單機架構(gòu)

image

clipboard.png

以淘寶作為例子客叉。在網(wǎng)站最初時诵竭,應(yīng)用數(shù)量與用戶數(shù)都較少,可以把Tomcat和數(shù)據(jù)庫部署在同一臺服務(wù)器上兼搏。瀏覽器往www.taobao.com發(fā)起請求時卵慰,首先經(jīng)過DNS服務(wù)器(域名系統(tǒng))把域名轉(zhuǎn)換為實際IP地址10.102.4.1,瀏覽器轉(zhuǎn)而訪問該IP對應(yīng)的Tomcat向族。

隨著用戶數(shù)的增長呵燕,Tomcat和數(shù)據(jù)庫之間競爭資源,單機性能不足以支撐業(yè)務(wù)

3.2 第一次演進(jìn):Tomcat與數(shù)據(jù)庫分開部署

image

clipboard.png

Tomcat和數(shù)據(jù)庫分別獨占服務(wù)器資源件相,顯著提高兩者各自性能再扭。

隨著用戶數(shù)的增長,并發(fā)讀寫數(shù)據(jù)庫成為瓶頸

3.3 第二次演進(jìn):引入本地緩存和分布式緩存

image

clipboard.png

在Tomcat同服務(wù)器上或同JVM中增加本地緩存夜矗,并在外部增加分布式緩存泛范,緩存熱門商品信息或熱門商品的html頁面等。通過緩存能把絕大多數(shù)請求在讀寫數(shù)據(jù)庫前攔截掉紊撕,大大降低數(shù)據(jù)庫壓力罢荡。其中涉及的技術(shù)包括:使用memcached作為本地緩存,使用Redis作為分布式緩存,還會涉及緩存一致性区赵、緩存穿透/擊穿惭缰、緩存雪崩、熱點數(shù)據(jù)集中失效等問題笼才。

緩存抗住了大部分的訪問請求漱受,隨著用戶數(shù)的增長捂寿,并發(fā)壓力主要落在單機的Tomcat上恤左,響應(yīng)逐漸變慢

3.4 第三次演進(jìn):引入反向代理實現(xiàn)負(fù)載均衡

image

clipboard.png

在多臺服務(wù)器上分別部署Tomcat,使用反向代理軟件(Nginx)把請求均勻分發(fā)到每個Tomcat中鸣皂。此處假設(shè)Tomcat最多支持100個并發(fā)摔踱,Nginx最多支持50000個并發(fā)虐先,那么理論上Nginx把請求分發(fā)到500個Tomcat上,就能抗住50000個并發(fā)派敷。其中涉及的技術(shù)包括:Nginx蛹批、HAProxy,兩者都是工作在網(wǎng)絡(luò)第七層的反向代理軟件膀息,主要支持http協(xié)議般眉,還會涉及session共享、文件上傳下載的問題潜支。

反向代理使應(yīng)用服務(wù)器可支持的并發(fā)量大大增加甸赃,但并發(fā)量的增長也意味著更多請求穿透到數(shù)據(jù)庫,單機的數(shù)據(jù)庫最終成為瓶頸

3.5 第四次演進(jìn):數(shù)據(jù)庫讀寫分離

image

clipboard.png

把數(shù)據(jù)庫劃分為讀庫和寫庫冗酿,讀庫可以有多個埠对,通過同步機制把寫庫的數(shù)據(jù)同步到讀庫,對于需要查詢最新寫入數(shù)據(jù)場景裁替,可通過在緩存中多寫一份项玛,通過緩存獲得最新數(shù)據(jù)。其中涉及的技術(shù)包括:Mycat弱判,它是數(shù)據(jù)庫中間件襟沮,可通過它來組織數(shù)據(jù)庫的分離讀寫和分庫分表,客戶端通過它來訪問下層數(shù)據(jù)庫昌腰,還會涉及數(shù)據(jù)同步开伏,數(shù)據(jù)一致性的問題。

業(yè)務(wù)逐漸變多遭商,不同業(yè)務(wù)之間的訪問量差距較大固灵,不同業(yè)務(wù)直接競爭數(shù)據(jù)庫,相互影響性能

3.6 第五次演進(jìn):數(shù)據(jù)庫按業(yè)務(wù)分庫

image

clipboard.png

把不同業(yè)務(wù)的數(shù)據(jù)保存到不同的數(shù)據(jù)庫中劫流,使業(yè)務(wù)之間的資源競爭降低巫玻,對于訪問量大的業(yè)務(wù)丛忆,可以部署更多的服務(wù)器來支撐。這樣同時導(dǎo)致跨業(yè)務(wù)的表無法直接做關(guān)聯(lián)分析仍秤,需要通過其他途徑來解決熄诡,但這不是本文討論的重點,有興趣的可以自行搜索解決方案徒扶。

隨著用戶數(shù)的增長粮彤,單機的寫庫會逐漸會達(dá)到性能瓶頸

3.7 第六次演進(jìn):把大表拆分為小表

image

clipboard.png

比如針對評論數(shù)據(jù)根穷,可按照商品ID進(jìn)行hash姜骡,路由到對應(yīng)的表中存儲;針對支付記錄屿良,可按照小時創(chuàng)建表圈澈,每個小時表繼續(xù)拆分為小表,使用用戶ID或記錄編號來路由數(shù)據(jù)尘惧。只要實時操作的表數(shù)據(jù)量足夠小康栈,請求能夠足夠均勻的分發(fā)到多臺服務(wù)器上的小表,那數(shù)據(jù)庫就能通過水平擴(kuò)展的方式來提高性能喷橙。其中前面提到的Mycat也支持在大表拆分為小表情況下的訪問控制啥么。

這種做法顯著的增加了數(shù)據(jù)庫運維的難度,對DBA的要求較高贰逾。數(shù)據(jù)庫設(shè)計到這種結(jié)構(gòu)時悬荣,已經(jīng)可以稱為分布式數(shù)據(jù)庫,但是這只是一個邏輯的數(shù)據(jù)庫整體疙剑,數(shù)據(jù)庫里不同的組成部分是由不同的組件單獨來實現(xiàn)的氯迂,如分庫分表的管理和請求分發(fā),由Mycat實現(xiàn)言缤,SQL的解析由單機的數(shù)據(jù)庫實現(xiàn)嚼蚀,讀寫分離可能由網(wǎng)關(guān)和消息隊列來實現(xiàn),查詢結(jié)果的匯總可能由數(shù)據(jù)庫接口層來實現(xiàn)等等管挟,這種架構(gòu)其實是MPP(大規(guī)模并行處理)架構(gòu)的一類實現(xiàn)轿曙。

目前開源和商用都已經(jīng)有不少MPP數(shù)據(jù)庫,開源中比較流行的有Greenplum僻孝、TiDB导帝、Postgresql XC、HAWQ等皮璧,商用的如南大通用的GBase舟扎、睿帆科技的雪球DB、華為的LibrA等等悴务,不同的MPP數(shù)據(jù)庫的側(cè)重點也不一樣睹限,如TiDB更側(cè)重于分布式OLTP場景譬猫,Greenplum更側(cè)重于分布式OLAP場景,這些MPP數(shù)據(jù)庫基本都提供了類似Postgresql羡疗、Oracle染服、MySQL那樣的SQL標(biāo)準(zhǔn)支持能力,能把一個查詢解析為分布式的執(zhí)行計劃分發(fā)到每臺機器上并行執(zhí)行叨恨,最終由數(shù)據(jù)庫本身匯總數(shù)據(jù)進(jìn)行返回柳刮,也提供了諸如權(quán)限管理、分庫分表痒钝、事務(wù)秉颗、數(shù)據(jù)副本等能力,并且大多能夠支持100個節(jié)點以上的集群送矩,大大降低了數(shù)據(jù)庫運維的成本蚕甥,并且使數(shù)據(jù)庫也能夠?qū)崿F(xiàn)水平擴(kuò)展。

數(shù)據(jù)庫和Tomcat都能夠水平擴(kuò)展栋荸,可支撐的并發(fā)大幅提高菇怀,隨著用戶數(shù)的增長,最終單機的Nginx會成為瓶頸

3.8 第七次演進(jìn):使用LVS或F5來使多個Nginx負(fù)載均衡

image

clipboard.png

由于瓶頸在Nginx晌块,因此無法通過兩層的Nginx來實現(xiàn)多個Nginx的負(fù)載均衡爱沟。圖中的LVS和F5是工作在網(wǎng)絡(luò)第四層的負(fù)載均衡解決方案,其中LVS是軟件匆背,運行在操作系統(tǒng)內(nèi)核態(tài)呼伸,可對TCP請求或更高層級的網(wǎng)絡(luò)協(xié)議進(jìn)行轉(zhuǎn)發(fā),因此支持的協(xié)議更豐富靠汁,并且性能也遠(yuǎn)高于Nginx蜂大,可假設(shè)單機的LVS可支持幾十萬個并發(fā)的請求轉(zhuǎn)發(fā);F5是一種負(fù)載均衡硬件蝶怔,與LVS提供的能力類似奶浦,性能比LVS更高,但價格昂貴踢星。由于LVS是單機版的軟件澳叉,若LVS所在服務(wù)器宕機則會導(dǎo)致整個后端系統(tǒng)都無法訪問,因此需要有備用節(jié)點沐悦〕上矗可使用keepalived軟件模擬出虛擬IP,然后把虛擬IP綁定到多臺LVS服務(wù)器上藏否,瀏覽器訪問虛擬IP時瓶殃,會被路由器重定向到真實的LVS服務(wù)器,當(dāng)主LVS服務(wù)器宕機時副签,keepalived軟件會自動更新路由器中的路由表遥椿,把虛擬IP重定向到另外一臺正常的LVS服務(wù)器基矮,從而達(dá)到LVS服務(wù)器高可用的效果。

此處需要注意的是冠场,上圖中從Nginx層到Tomcat層這樣畫并不代表全部Nginx都轉(zhuǎn)發(fā)請求到全部的Tomcat家浇,在實際使用時,可能會是幾個Nginx下面接一部分的Tomcat碴裙,這些Nginx之間通過keepalived實現(xiàn)高可用钢悲,其他的Nginx接另外的Tomcat,這樣可接入的Tomcat數(shù)量就能成倍的增加舔株。

由于LVS也是單機的莺琳,隨著并發(fā)數(shù)增長到幾十萬時,LVS服務(wù)器最終會達(dá)到瓶頸督笆,此時用戶數(shù)達(dá)到千萬甚至上億級別芦昔,用戶分布在不同的地區(qū),與服務(wù)器機房距離不同娃肿,導(dǎo)致了訪問的延遲會明顯不同。

3.9 第八次演進(jìn):通過DNS輪詢實現(xiàn)機房間的負(fù)載均衡

image

clipboard.png

在DNS服務(wù)器中可配置一個域名對應(yīng)多個IP地址珠十,每個IP地址對應(yīng)到不同的機房里的虛擬IP料扰。當(dāng)用戶訪問www.taobao.com時,DNS服務(wù)器會使用輪詢策略或其他策略焙蹭,來選擇某個IP供用戶訪問晒杈。此方式能實現(xiàn)機房間的負(fù)載均衡,至此孔厉,系統(tǒng)可做到機房級別的水平擴(kuò)展拯钻,千萬級到億級的并發(fā)量都可通過增加機房來解決,系統(tǒng)入口處的請求并發(fā)量不再是問題撰豺。

隨著數(shù)據(jù)的豐富程度和業(yè)務(wù)的發(fā)展粪般,檢索、分析等需求越來越豐富污桦,單單依靠數(shù)據(jù)庫無法解決如此豐富的需求

3.10 第九次演進(jìn):引入NoSQL數(shù)據(jù)庫和搜索引擎等技術(shù)

image

clipboard.png

當(dāng)數(shù)據(jù)庫中的數(shù)據(jù)多到一定規(guī)模時亩歹,數(shù)據(jù)庫就不適用于復(fù)雜的查詢了,往往只能滿足普通查詢的場景凡橱。對于統(tǒng)計報表場景小作,在數(shù)據(jù)量大時不一定能跑出結(jié)果,而且在跑復(fù)雜查詢時會導(dǎo)致其他查詢變慢稼钩,對于全文檢索顾稀、可變數(shù)據(jù)結(jié)構(gòu)等場景,數(shù)據(jù)庫天生不適用坝撑。因此需要針對特定的場景静秆,引入合適的解決方案氮块。如對于海量文件存儲,可通過分布式文件系統(tǒng)HDFS解決诡宗,對于key value類型的數(shù)據(jù)滔蝉,可通過HBase和Redis等方案解決,對于全文檢索場景塔沃,可通過搜索引擎如ElasticSearch解決蝠引,對于多維分析場景,可通過Kylin或Druid等方案解決蛀柴。

當(dāng)然螃概,引入更多組件同時會提高系統(tǒng)的復(fù)雜度,不同的組件保存的數(shù)據(jù)需要同步鸽疾,需要考慮一致性的問題吊洼,需要有更多的運維手段來管理這些組件等。

引入更多組件解決了豐富的需求制肮,業(yè)務(wù)維度能夠極大擴(kuò)充冒窍,隨之而來的是一個應(yīng)用中包含了太多的業(yè)務(wù)代碼,業(yè)務(wù)的升級迭代變得困難

3.11 第十次演進(jìn):大應(yīng)用拆分為小應(yīng)用

image

clipboard.png

按照業(yè)務(wù)板塊來劃分應(yīng)用代碼豺鼻,使單個應(yīng)用的職責(zé)更清晰综液,相互之間可以做到獨立升級迭代。這時候應(yīng)用之間可能會涉及到一些公共配置儒飒,可以通過分布式配置中心Zookeeper來解決谬莹。

不同應(yīng)用之間存在共用的模塊,由應(yīng)用單獨管理會導(dǎo)致相同代碼存在多份桩了,導(dǎo)致公共功能升級時全部應(yīng)用代碼都要跟著升級

3.12 第十一次演進(jìn):復(fù)用的功能抽離成微服務(wù)

image

clipboard.png

如用戶管理附帽、訂單、支付井誉、鑒權(quán)等功能在多個應(yīng)用中都存在蕉扮,那么可以把這些功能的代碼單獨抽取出來形成一個單獨的服務(wù)來管理,這樣的服務(wù)就是所謂的微服務(wù)送悔,應(yīng)用和服務(wù)之間通過HTTP慢显、TCP或RPC請求等多種方式來訪問公共服務(wù),每個單獨的服務(wù)都可以由單獨的團(tuán)隊來管理欠啤。此外荚藻,可以通過Dubbo、SpringCloud等框架實現(xiàn)服務(wù)治理洁段、限流应狱、熔斷、降級等功能祠丝,提高服務(wù)的穩(wěn)定性和可用性疾呻。

不同服務(wù)的接口訪問方式不同除嘹,應(yīng)用代碼需要適配多種訪問方式才能使用服務(wù),此外岸蜗,應(yīng)用訪問服務(wù)尉咕,服務(wù)之間也可能相互訪問,調(diào)用鏈將會變得非常復(fù)雜璃岳,邏輯變得混亂

3.13 第十二次演進(jìn):引入企業(yè)服務(wù)總線ESB屏蔽服務(wù)接口的訪問差異

image

clipboard.png

通過ESB統(tǒng)一進(jìn)行訪問協(xié)議轉(zhuǎn)換年缎,應(yīng)用統(tǒng)一通過ESB來訪問后端服務(wù),服務(wù)與服務(wù)之間也通過ESB來相互調(diào)用铃慷,以此降低系統(tǒng)的耦合程度单芜。這種單個應(yīng)用拆分為多個應(yīng)用,公共服務(wù)單獨抽取出來來管理犁柜,并使用企業(yè)消息總線來解除服務(wù)之間耦合問題的架構(gòu)洲鸠,就是所謂的SOA(面向服務(wù))架構(gòu),這種架構(gòu)與微服務(wù)架構(gòu)容易混淆馋缅,因為表現(xiàn)形式十分相似扒腕。個人理解,微服務(wù)架構(gòu)更多是指把系統(tǒng)里的公共服務(wù)抽取出來單獨運維管理的思想股囊,而SOA架構(gòu)則是指一種拆分服務(wù)并使服務(wù)接口訪問變得統(tǒng)一的架構(gòu)思想袜匿,SOA架構(gòu)中包含了微服務(wù)的思想。

業(yè)務(wù)不斷發(fā)展稚疹,應(yīng)用和服務(wù)都會不斷變多,應(yīng)用和服務(wù)的部署變得復(fù)雜祭务,同一臺服務(wù)器上部署多個服務(wù)還要解決運行環(huán)境沖突的問題内狗,此外,對于如大促這類需要動態(tài)擴(kuò)縮容的場景义锥,需要水平擴(kuò)展服務(wù)的性能柳沙,就需要在新增的服務(wù)上準(zhǔn)備運行環(huán)境,部署服務(wù)等拌倍,運維將變得十分困難

3.14 第十三次演進(jìn):引入容器化技術(shù)實現(xiàn)運行環(huán)境隔離與動態(tài)服務(wù)管理

image

clipboard.png

目前最流行的容器化技術(shù)是Docker赂鲤,最流行的容器管理服務(wù)是Kubernetes(K8S),應(yīng)用/服務(wù)可以打包為Docker鏡像柱恤,通過K8S來動態(tài)分發(fā)和部署鏡像数初。Docker鏡像可理解為一個能運行你的應(yīng)用/服務(wù)的最小的操作系統(tǒng),里面放著應(yīng)用/服務(wù)的運行代碼梗顺,運行環(huán)境根據(jù)實際的需要設(shè)置好泡孩。把整個“操作系統(tǒng)”打包為一個鏡像后,就可以分發(fā)到需要部署相關(guān)服務(wù)的機器上寺谤,直接啟動Docker鏡像就可以把服務(wù)起起來仑鸥,使服務(wù)的部署和運維變得簡單吮播。

在大促的之前,可以在現(xiàn)有的機器集群上劃分出服務(wù)器來啟動Docker鏡像眼俊,增強服務(wù)的性能意狠,大促過后就可以關(guān)閉鏡像,對機器上的其他服務(wù)不造成影響(在3.14節(jié)之前疮胖,服務(wù)運行在新增機器上需要修改系統(tǒng)配置來適配服務(wù)环戈,這會導(dǎo)致機器上其他服務(wù)需要的運行環(huán)境被破壞)。

使用容器化技術(shù)后服務(wù)動態(tài)擴(kuò)縮容問題得以解決获列,但是機器還是需要公司自身來管理谷市,在非大促的時候,還是需要閑置著大量的機器資源來應(yīng)對大促击孩,機器自身成本和運維成本都極高迫悠,資源利用率低

3.15 第十四次演進(jìn):以云平臺承載系統(tǒng)

image

clipboard.png

系統(tǒng)可部署到公有云上,利用公有云的海量機器資源巩梢,解決動態(tài)硬件資源的問題创泄,在大促的時間段里,在云平臺中臨時申請更多的資源括蝠,結(jié)合Docker和K8S來快速部署服務(wù)鞠抑,在大促結(jié)束后釋放資源,真正做到按需付費忌警,資源利用率大大提高搁拙,同時大大降低了運維成本。

所謂的云平臺法绵,就是把海量機器資源箕速,通過統(tǒng)一的資源管理,抽象為一個資源整體朋譬,在之上可按需動態(tài)申請硬件資源(如CPU盐茎、內(nèi)存、網(wǎng)絡(luò)等)徙赢,并且之上提供通用的操作系統(tǒng)字柠,提供常用的技術(shù)組件(如Hadoop技術(shù)棧,MPP數(shù)據(jù)庫等)供用戶使用狡赐,甚至提供開發(fā)好的應(yīng)用窑业,用戶不需要關(guān)系應(yīng)用內(nèi)部使用了什么技術(shù),就能夠解決需求(如音視頻轉(zhuǎn)碼服務(wù)阴汇、郵件服務(wù)数冬、個人博客等)。在云平臺中會涉及如下幾個概念:

  • IaaS:基礎(chǔ)設(shè)施即服務(wù)。對應(yīng)于上面所說的機器資源統(tǒng)一為資源整體拐纱,可動態(tài)申請硬件資源的層面铜异;

  • PaaS:平臺即服務(wù)。對應(yīng)于上面所說的提供常用的技術(shù)組件方便系統(tǒng)的開發(fā)和維護(hù)秸架;

  • SaaS:軟件即服務(wù)揍庄。對應(yīng)于上面所說的提供開發(fā)好的應(yīng)用或服務(wù),按功能或性能要求付費东抹。

至此蚂子,以上所提到的從高并發(fā)訪問問題,到服務(wù)的架構(gòu)和系統(tǒng)實施的層面都有了各自的解決方案缭黔,但同時也應(yīng)該意識到食茎,在上面的介紹中,其實是有意忽略了諸如跨機房數(shù)據(jù)同步馏谨、分布式事務(wù)實現(xiàn)等等的實際問題别渔,這些問題以后有機會再拿出來單獨討論

4. 架構(gòu)設(shè)計總結(jié)

架構(gòu)的調(diào)整是否必須按照上述演變路徑進(jìn)行?不是的惧互,以上所說的架構(gòu)演變順序只是針對某個側(cè)面進(jìn)行單獨的改進(jìn)哎媚,在實際場景中,可能同一時間會有幾個問題需要解決喊儡,或者可能先達(dá)到瓶頸的是另外的方面拨与,這時候就應(yīng)該按照實際問題實際解決。如在政府類的并發(fā)量可能不大艾猜,但業(yè)務(wù)可能很豐富的場景买喧,高并發(fā)就不是重點解決的問題,此時優(yōu)先需要的可能會是豐富需求的解決方案匆赃。對于將要實施的系統(tǒng)岗喉,架構(gòu)應(yīng)該設(shè)計到什么程度?對于單次實施并且性能指標(biāo)明確的系統(tǒng)炸庞,架構(gòu)設(shè)計到能夠支持系統(tǒng)的性能指標(biāo)要求就足夠了,但要留有擴(kuò)展架構(gòu)的接口以便不備之需荚斯。對于不斷發(fā)展的系統(tǒng)埠居,如電商平臺,應(yīng)設(shè)計到能滿足下一階段用戶量和性能指標(biāo)要求的程度事期,并根據(jù)業(yè)務(wù)的增長不斷的迭代升級架構(gòu)滥壕,以支持更高的并發(fā)和更豐富的業(yè)務(wù)。服務(wù)端架構(gòu)和大數(shù)據(jù)架構(gòu)有什么區(qū)別兽泣?所謂的“大數(shù)據(jù)”其實是海量數(shù)據(jù)采集清洗轉(zhuǎn)換绎橘、數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)服務(wù)等場景解決方案的一個統(tǒng)稱称鳞,在每一個場景都包含了多種可選的技術(shù)涮较,如數(shù)據(jù)采集有Flume、Sqoop冈止、Kettle等狂票,數(shù)據(jù)存儲有分布式文件系統(tǒng)HDFS、FastDFS熙暴,NoSQL數(shù)據(jù)庫HBase闺属、MongoDB等,數(shù)據(jù)分析有Spark技術(shù)棧周霉、機器學(xué)習(xí)算法等掂器。總的來說大數(shù)據(jù)架構(gòu)就是根據(jù)業(yè)務(wù)的需求俱箱,整合各種大數(shù)據(jù)組件組合而成的架構(gòu)国瓮,一般會提供分布式存儲、分布式計算匠楚、多維分析巍膘、數(shù)據(jù)倉庫、機器學(xué)習(xí)算法等能力芋簿。而服務(wù)端架構(gòu)更多指的是應(yīng)用組織層面的架構(gòu)峡懈,底層能力往往是由大數(shù)據(jù)架構(gòu)來提供。

有沒有一些架構(gòu)設(shè)計的原則与斤?

  • N+1設(shè)計肪康。系統(tǒng)中的每個組件都應(yīng)做到?jīng)]有單點故障;

  • 回滾設(shè)計撩穿。確保系統(tǒng)可以向前兼容磷支,在系統(tǒng)升級時應(yīng)能有辦法回滾版本;

  • 禁用設(shè)計食寡。應(yīng)該提供控制具體功能是否可用的配置雾狈,在系統(tǒng)出現(xiàn)故障時能夠快速下線功能;

  • 監(jiān)控設(shè)計抵皱。在設(shè)計階段就要考慮監(jiān)控的手段善榛;

  • 多活數(shù)據(jù)中心設(shè)計。若系統(tǒng)需要極高的高可用呻畸,應(yīng)考慮在多地實施數(shù)據(jù)中心進(jìn)行多活移盆,至少在一個機房斷電的情況下系統(tǒng)依然可用;

  • 采用成熟的技術(shù)伤为。剛開發(fā)的或開源的技術(shù)往往存在很多隱藏的bug咒循,出了問題沒有商業(yè)支持可能會是一個災(zāi)難;

  • 資源隔離設(shè)計。應(yīng)避免單一業(yè)務(wù)占用全部資源叙甸;

  • 架構(gòu)應(yīng)能水平擴(kuò)展颖医。系統(tǒng)只有做到能水平擴(kuò)展,才能有效避免瓶頸問題蚁署;

  • 非核心則購買便脊。非核心功能若需要占用大量的研發(fā)資源才能解決,則考慮購買成熟的產(chǎn)品光戈;

  • 使用商用硬件哪痰。商用硬件能有效降低硬件故障的機率;

  • 快速迭代久妆。系統(tǒng)應(yīng)該快速開發(fā)小功能模塊晌杰,盡快上線進(jìn)行驗證,早日發(fā)現(xiàn)問題大大降低系統(tǒng)交付的風(fēng)險筷弦;

轉(zhuǎn)自:https://xie.infoq.cn/article/1723a423b2cb41cf787db0d93

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末肋演,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子烂琴,更是在濱河造成了極大的恐慌爹殊,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,252評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件奸绷,死亡現(xiàn)場離奇詭異梗夸,居然都是意外死亡,警方通過查閱死者的電腦和手機号醉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評論 3 399
  • 文/潘曉璐 我一進(jìn)店門反症,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人畔派,你說我怎么就攤上這事铅碍。” “怎么了线椰?”我有些...
    開封第一講書人閱讀 168,814評論 0 361
  • 文/不壞的土叔 我叫張陵胞谈,是天一觀的道長。 經(jīng)常有香客問我憨愉,道長呜魄,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,869評論 1 299
  • 正文 為了忘掉前任莱衩,我火速辦了婚禮,結(jié)果婚禮上娇澎,老公的妹妹穿的比我還像新娘笨蚁。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 68,888評論 6 398
  • 文/花漫 我一把揭開白布括细。 她就那樣靜靜地躺著伪很,像睡著了一般。 火紅的嫁衣襯著肌膚如雪奋单。 梳的紋絲不亂的頭發(fā)上锉试,一...
    開封第一講書人閱讀 52,475評論 1 312
  • 那天,我揣著相機與錄音览濒,去河邊找鬼呆盖。 笑死,一個胖子當(dāng)著我的面吹牛贷笛,可吹牛的內(nèi)容都是我干的应又。 我是一名探鬼主播,決...
    沈念sama閱讀 41,010評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼乏苦,長吁一口氣:“原來是場噩夢啊……” “哼株扛!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起汇荐,我...
    開封第一講書人閱讀 39,924評論 0 277
  • 序言:老撾萬榮一對情侶失蹤洞就,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后掀淘,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體旬蟋,經(jīng)...
    沈念sama閱讀 46,469評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,552評論 3 342
  • 正文 我和宋清朗相戀三年繁疤,在試婚紗的時候發(fā)現(xiàn)自己被綠了咖为。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,680評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡稠腊,死狀恐怖躁染,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情架忌,我是刑警寧澤吞彤,帶...
    沈念sama閱讀 36,362評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站叹放,受9級特大地震影響饰恕,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜井仰,卻給世界環(huán)境...
    茶點故事閱讀 42,037評論 3 335
  • 文/蒙蒙 一埋嵌、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧俱恶,春花似錦雹嗦、人聲如沸范舀。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,519評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽锭环。三九已至,卻和暖如春泊藕,著一層夾襖步出監(jiān)牢的瞬間辅辩,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,621評論 1 274
  • 我被黑心中介騙來泰國打工娃圆, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留玫锋,地道東北人。 一個月前我還...
    沈念sama閱讀 49,099評論 3 378
  • 正文 我出身青樓踊餐,卻偏偏與公主長得像景醇,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子吝岭,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,691評論 2 361