[轉(zhuǎn)]服務(wù)端高并發(fā)分布式架構(gòu)演進之路

> 原文： [https://segmentfault.com/a/1190000018626163](https://segmentfault.com/a/1190000018626163)

1. 概述

本文以淘寶作為例子掸犬，介紹從一百個并發(fā)到千萬級并發(fā)情況下服務(wù)端的架構(gòu)的演進過程，同時列舉出每個演進階段會遇到的相關(guān)技術(shù)，讓大家對架構(gòu)的演進有一個整體的認知，文章最后匯總了一些架構(gòu)設(shè)計的原則或渤。

2. 基本概念

在介紹架構(gòu)之前抄肖，為了避免部分讀者對架構(gòu)設(shè)計中的一些概念不了解，下面對幾個最基礎(chǔ)的概念進行介紹：

分布式

系統(tǒng)中的多個模塊在不同服務(wù)器上部署冷冗，即可稱為分布式系統(tǒng)催跪，如Tomcat和數(shù)據(jù)庫分別部署在不同的服務(wù)器上锁蠕，或兩個相同功能的Tomcat分別部署在不同服務(wù)器上

高可用

系統(tǒng)中部分節(jié)點失效時，其他節(jié)點能夠接替它繼續(xù)提供服務(wù)懊蒸，則可認為系統(tǒng)具有高可用性

集群

一個特定領(lǐng)域的軟件部署在多臺服務(wù)器上并作為一個整體提供一類服務(wù)荣倾，這個整體稱為集群。如Zookeeper中的Master和Slave分別部署在多臺服務(wù)器上骑丸，共同組成一個整體提供集中配置服務(wù)舌仍。在常見的集群中，客戶端往往能夠連接任意一個節(jié)點獲得服務(wù)通危，并且當集群中一個節(jié)點掉線時铸豁，其他節(jié)點往往能夠自動的接替它繼續(xù)提供服務(wù)，這時候說明集群具有高可用性

負載均衡

請求發(fā)送到系統(tǒng)時菊碟，通過某些方式把請求均勻分發(fā)到多個節(jié)點上节芥，使系統(tǒng)中每個節(jié)點能夠均勻的處理請求負載，則可認為系統(tǒng)是負載均衡的

正向代理和反向代理

系統(tǒng)內(nèi)部要訪問外部網(wǎng)絡(luò)時框沟，統(tǒng)一通過一個代理服務(wù)器把請求轉(zhuǎn)發(fā)出去，在外部網(wǎng)絡(luò)看來就是代理服務(wù)器發(fā)起的訪問增炭，此時代理服務(wù)器實現(xiàn)的是正向代理忍燥；當外部請求進入系統(tǒng)時，代理服務(wù)器把該請求轉(zhuǎn)發(fā)到系統(tǒng)中的某臺服務(wù)器上隙姿，對外部請求來說梅垄，與之交互的只有代理服務(wù)器，此時代理服務(wù)器實現(xiàn)的是反向代理输玷。簡單來說队丝，正向代理是代理服務(wù)器代替系統(tǒng)內(nèi)部來訪問外部網(wǎng)絡(luò)的過程，反向代理是外部請求訪問系統(tǒng)時通過代理服務(wù)器轉(zhuǎn)發(fā)到內(nèi)部服務(wù)器的過程欲鹏。

3. 架構(gòu)演進

單機架構(gòu)

以淘寶作為例子机久。在網(wǎng)站最初時，應(yīng)用數(shù)量與用戶數(shù)都較少赔嚎，可以把Tomcat和數(shù)據(jù)庫部署在同一臺服務(wù)器上膘盖。瀏覽器往www.taobao.com發(fā)起請求時胧弛，首先經(jīng)過DNS服務(wù)器（域名系統(tǒng)）把域名轉(zhuǎn)換為實際IP地址10.102.4.1，瀏覽器轉(zhuǎn)而訪問該IP對應(yīng)的Tomcat侠畔。

隨著用戶數(shù)的增長结缚，Tomcat和數(shù)據(jù)庫之間競爭資源，單機性能不足以支撐業(yè)務(wù)

第一次演進：Tomcat與數(shù)據(jù)庫分開部署

Tomcat和數(shù)據(jù)庫分別獨占服務(wù)器資源软棺，顯著提高兩者各自性能红竭。

隨著用戶數(shù)的增長，并發(fā)讀寫數(shù)據(jù)庫成為瓶頸

第二次演進：引入本地緩存和分布式緩存

在Tomcat同服務(wù)器上或同JVM中增加本地緩存喘落，并在外部增加分布式緩存茵宪，緩存熱門商品信息或熱門商品的html頁面等。通過緩存能把絕大多數(shù)請求在讀寫數(shù)據(jù)庫前攔截掉揖盘，大大降低數(shù)據(jù)庫壓力眉厨。其中涉及的技術(shù)包括：使用memcached作為本地緩存，使用Redis作為分布式緩存兽狭，還會涉及緩存一致性憾股、緩存穿透/擊穿、緩存雪崩箕慧、熱點數(shù)據(jù)集中失效等問題服球。

緩存抗住了大部分的訪問請求，隨著用戶數(shù)的增長颠焦，并發(fā)壓力主要落在單機的Tomcat上斩熊，響應(yīng)逐漸變慢

第三次演進：引入反向代理實現(xiàn)負載均衡

在多臺服務(wù)器上分別部署Tomcat，使用反向代理軟件（Nginx）把請求均勻分發(fā)到每個Tomcat中伐庭。此處假設(shè)Tomcat最多支持100個并發(fā)粉渠，Nginx最多支持50000個并發(fā)，那么理論上Nginx把請求分發(fā)到500個Tomcat上圾另，就能抗住50000個并發(fā)霸株。其中涉及的技術(shù)包括：Nginx、HAProxy集乔，兩者都是工作在網(wǎng)絡(luò)第七層的反向代理軟件去件，主要支持http協(xié)議，還會涉及session共享扰路、文件上傳下載的問題尤溜。

反向代理使應(yīng)用服務(wù)器可支持的并發(fā)量大大增加，但并發(fā)量的增長也意味著更多請求穿透到數(shù)據(jù)庫汗唱，單機的數(shù)據(jù)庫最終成為瓶頸

第四次演進：數(shù)據(jù)庫讀寫分離

把數(shù)據(jù)庫劃分為讀庫和寫庫宫莱，讀庫可以有多個，通過同步機制把寫庫的數(shù)據(jù)同步到讀庫哩罪，對于需要查詢最新寫入數(shù)據(jù)場景梢睛，可通過在緩存中多寫一份肥印，通過緩存獲得最新數(shù)據(jù)。其中涉及的技術(shù)包括：Mycat绝葡，它是數(shù)據(jù)庫中間件深碱，可通過它來組織數(shù)據(jù)庫的分離讀寫和分庫分表，客戶端通過它來訪問下層數(shù)據(jù)庫藏畅，還會涉及數(shù)據(jù)同步敷硅，數(shù)據(jù)一致性的問題。

業(yè)務(wù)逐漸變多愉阎，不同業(yè)務(wù)之間的訪問量差距較大绞蹦，不同業(yè)務(wù)直接競爭數(shù)據(jù)庫，相互影響性能

第五次演進：數(shù)據(jù)庫按業(yè)務(wù)分庫

把不同業(yè)務(wù)的數(shù)據(jù)保存到不同的數(shù)據(jù)庫中榜旦，使業(yè)務(wù)之間的資源競爭降低幽七，對于訪問量大的業(yè)務(wù)，可以部署更多的服務(wù)器來支撐溅呢。這樣同時導致跨業(yè)務(wù)的表無法直接做關(guān)聯(lián)分析澡屡，需要通過其他途徑來解決，但這不是本文討論的重點咐旧，有興趣的可以自行搜索解決方案驶鹉。

隨著用戶數(shù)的增長，單機的寫庫會逐漸會達到性能瓶頸

第六次演進：把大表拆分為小表

比如針對評論數(shù)據(jù)铣墨，可按照商品ID進行hash室埋，路由到對應(yīng)的表中存儲；針對支付記錄伊约，可按照小時創(chuàng)建表姚淆，每個小時表繼續(xù)拆分為小表，使用用戶ID或記錄編號來路由數(shù)據(jù)屡律。只要實時操作的表數(shù)據(jù)量足夠小腌逢，請求能夠足夠均勻的分發(fā)到多臺服務(wù)器上的小表，那數(shù)據(jù)庫就能通過水平擴展的方式來提高性能疹尾。其中前面提到的Mycat也支持在大表拆分為小表情況下的訪問控制上忍。

這種做法顯著的增加了數(shù)據(jù)庫運維的難度骤肛，對DBA的要求較高纳本。數(shù)據(jù)庫設(shè)計到這種結(jié)構(gòu)時，已經(jīng)可以稱為分布式數(shù)據(jù)庫腋颠，但是這只是一個邏輯的數(shù)據(jù)庫整體繁成，數(shù)據(jù)庫里不同的組成部分是由不同的組件單獨來實現(xiàn)的，如分庫分表的管理和請求分發(fā)淑玫，由Mycat實現(xiàn)巾腕，SQL的解析由單機的數(shù)據(jù)庫實現(xiàn)面睛，讀寫分離可能由網(wǎng)關(guān)和消息隊列來實現(xiàn)，查詢結(jié)果的匯總可能由數(shù)據(jù)庫接口層來實現(xiàn)等等尊搬，這種架構(gòu)其實是MPP（大規(guī)模并行處理）架構(gòu)的一類實現(xiàn)叁鉴。

目前開源和商用都已經(jīng)有不少MPP數(shù)據(jù)庫，開源中比較流行的有Greenplum佛寿、TiDB幌墓、Postgresql XC、HAWQ等冀泻，商用的如南大通用的GBase常侣、睿帆科技的雪球DB、華為的LibrA等等弹渔，不同的MPP數(shù)據(jù)庫的側(cè)重點也不一樣胳施，如TiDB更側(cè)重于分布式OLTP場景，Greenplum更側(cè)重于分布式OLAP場景肢专，這些MPP數(shù)據(jù)庫基本都提供了類似Postgresql舞肆、Oracle、MySQL那樣的SQL標準支持能力鸟召，能把一個查詢解析為分布式的執(zhí)行計劃分發(fā)到每臺機器上并行執(zhí)行胆绊，最終由數(shù)據(jù)庫本身匯總數(shù)據(jù)進行返回，也提供了諸如權(quán)限管理欧募、分庫分表压状、事務(wù)、數(shù)據(jù)副本等能力跟继，并且大多能夠支持100個節(jié)點以上的集群种冬，大大降低了數(shù)據(jù)庫運維的成本，并且使數(shù)據(jù)庫也能夠?qū)崿F(xiàn)水平擴展舔糖。

數(shù)據(jù)庫和Tomcat都能夠水平擴展娱两，可支撐的并發(fā)大幅提高，隨著用戶數(shù)的增長金吗，最終單機的Nginx會成為瓶頸

第七次演進：使用LVS或F5來使多個Nginx負載均衡

由于瓶頸在Nginx十兢，因此無法通過兩層的Nginx來實現(xiàn)多個Nginx的負載均衡。圖中的LVS和F5是工作在網(wǎng)絡(luò)第四層的負載均衡解決方案摇庙，其中LVS是軟件旱物，運行在操作系統(tǒng)內(nèi)核態(tài)，可對TCP請求或更高層級的網(wǎng)絡(luò)協(xié)議進行轉(zhuǎn)發(fā)卫袒，因此支持的協(xié)議更豐富宵呛，并且性能也遠高于Nginx，可假設(shè)單機的LVS可支持幾十萬個并發(fā)的請求轉(zhuǎn)發(fā)夕凝；F5是一種負載均衡硬件宝穗，與LVS提供的能力類似户秤，性能比LVS更高，但價格昂貴逮矛。由于LVS是單機版的軟件鸡号，若LVS所在服務(wù)器宕機則會導致整個后端系統(tǒng)都無法訪問，因此需要有備用節(jié)點须鼎∧ご溃可使用keepalived軟件模擬出虛擬IP，然后把虛擬IP綁定到多臺LVS服務(wù)器上莉兰，瀏覽器訪問虛擬IP時挑围，會被路由器重定向到真實的LVS服務(wù)器，當主LVS服務(wù)器宕機時糖荒，keepalived軟件會自動更新路由器中的路由表杉辙，把虛擬IP重定向到另外一臺正常的LVS服務(wù)器，從而達到LVS服務(wù)器高可用的效果捶朵。

此處需要注意的是蜘矢，上圖中從Nginx層到Tomcat層這樣畫并不代表全部Nginx都轉(zhuǎn)發(fā)請求到全部的Tomcat，在實際使用時综看，可能會是幾個Nginx下面接一部分的Tomcat品腹，這些Nginx之間通過keepalived實現(xiàn)高可用，其他的Nginx接另外的Tomcat红碑，這樣可接入的Tomcat數(shù)量就能成倍的增加舞吭。

由于LVS也是單機的，隨著并發(fā)數(shù)增長到幾十萬時析珊，LVS服務(wù)器最終會達到瓶頸羡鸥，此時用戶數(shù)達到千萬甚至上億級別，用戶分布在不同的地區(qū)忠寻，與服務(wù)器機房距離不同惧浴，導致了訪問的延遲會明顯不同

第八次演進：通過DNS輪詢實現(xiàn)機房間的負載均衡

在DNS服務(wù)器中可配置一個域名對應(yīng)多個IP地址，每個IP地址對應(yīng)到不同的機房里的虛擬IP奕剃。當用戶訪問www.taobao.com時衷旅，DNS服務(wù)器會使用輪詢策略或其他策略，來選擇某個IP供用戶訪問纵朋。此方式能實現(xiàn)機房間的負載均衡柿顶，至此，系統(tǒng)可做到機房級別的水平擴展倡蝙，千萬級到億級的并發(fā)量都可通過增加機房來解決九串，系統(tǒng)入口處的請求并發(fā)量不再是問題绞佩。

隨著數(shù)據(jù)的豐富程度和業(yè)務(wù)的發(fā)展寺鸥，檢索猪钮、分析等需求越來越豐富，單單依靠數(shù)據(jù)庫無法解決如此豐富的需求

第九次演進：引入NoSQL數(shù)據(jù)庫和搜索引擎等技術(shù)

當數(shù)據(jù)庫中的數(shù)據(jù)多到一定規(guī)模時胆建，數(shù)據(jù)庫就不適用于復雜的查詢了烤低，往往只能滿足普通查詢的場景。對于統(tǒng)計報表場景笆载，在數(shù)據(jù)量大時不一定能跑出結(jié)果扑馁，而且在跑復雜查詢時會導致其他查詢變慢，對于全文檢索凉驻、可變數(shù)據(jù)結(jié)構(gòu)等場景腻要，數(shù)據(jù)庫天生不適用。因此需要針對特定的場景涝登，引入合適的解決方案雄家。如對于海量文件存儲，可通過分布式文件系統(tǒng)HDFS解決胀滚，對于key value類型的數(shù)據(jù)趟济，可通過HBase和Redis等方案解決，對于全文檢索場景咽笼，可通過搜索引擎如ElasticSearch解決顷编，對于多維分析場景，可通過Kylin或Druid等方案解決剑刑。

當然媳纬，引入更多組件同時會提高系統(tǒng)的復雜度，不同的組件保存的數(shù)據(jù)需要同步施掏，需要考慮一致性的問題层宫，需要有更多的運維手段來管理這些組件等。

引入更多組件解決了豐富的需求其监，業(yè)務(wù)維度能夠極大擴充萌腿，隨之而來的是一個應(yīng)用中包含了太多的業(yè)務(wù)代碼，業(yè)務(wù)的升級迭代變得困難

第十次演進：大應(yīng)用拆分為小應(yīng)用

按照業(yè)務(wù)板塊來劃分應(yīng)用代碼抖苦，使單個應(yīng)用的職責更清晰毁菱，相互之間可以做到獨立升級迭代。這時候應(yīng)用之間可能會涉及到一些公共配置锌历，可以通過分布式配置中心Zookeeper來解決贮庞。

不同應(yīng)用之間存在共用的模塊，由應(yīng)用單獨管理會導致相同代碼存在多份究西，導致公共功能升級時全部應(yīng)用代碼都要跟著升級

第十一次演進：復用的功能抽離成微服務(wù)

如用戶管理窗慎、訂單、支付、鑒權(quán)等功能在多個應(yīng)用中都存在遮斥，那么可以把這些功能的代碼單獨抽取出來形成一個單獨的服務(wù)來管理峦失，這樣的服務(wù)就是所謂的微服務(wù)，應(yīng)用和服務(wù)之間通過HTTP术吗、TCP或RPC請求等多種方式來訪問公共服務(wù)尉辑，每個單獨的服務(wù)都可以由單獨的團隊來管理。此外较屿，可以通過Dubbo隧魄、SpringCloud等框架實現(xiàn)服務(wù)治理、限流隘蝎、熔斷购啄、降級等功能，提高服務(wù)的穩(wěn)定性和可用性嘱么。

不同服務(wù)的接口訪問方式不同货裹，應(yīng)用代碼需要適配多種訪問方式才能使用服務(wù)露泊，此外，應(yīng)用訪問服務(wù)，服務(wù)之間也可能相互訪問祭椰，調(diào)用鏈將會變得非常復雜蒲讯，邏輯變得混亂

第十二次演進：引入企業(yè)服務(wù)總線ESB屏蔽服務(wù)接口的訪問差異

通過ESB統(tǒng)一進行訪問協(xié)議轉(zhuǎn)換垫蛆，應(yīng)用統(tǒng)一通過ESB來訪問后端服務(wù)违孝，服務(wù)與服務(wù)之間也通過ESB來相互調(diào)用，以此降低系統(tǒng)的耦合程度集索。這種單個應(yīng)用拆分為多個應(yīng)用屿愚，公共服務(wù)單獨抽取出來來管理，并使用企業(yè)消息總線來解除服務(wù)之間耦合問題的架構(gòu)务荆，就是所謂的SOA（面向服務(wù)）架構(gòu)妆距，這種架構(gòu)與微服務(wù)架構(gòu)容易混淆，因為表現(xiàn)形式十分相似函匕。個人理解娱据，微服務(wù)架構(gòu)更多是指把系統(tǒng)里的公共服務(wù)抽取出來單獨運維管理的思想，而SOA架構(gòu)則是指一種拆分服務(wù)并使服務(wù)接口訪問變得統(tǒng)一的架構(gòu)思想盅惜，SOA架構(gòu)中包含了微服務(wù)的思想中剩。

業(yè)務(wù)不斷發(fā)展，應(yīng)用和服務(wù)都會不斷變多抒寂，應(yīng)用和服務(wù)的部署變得復雜结啼，同一臺服務(wù)器上部署多個服務(wù)還要解決運行環(huán)境沖突的問題，此外屈芜，對于如大促這類需要動態(tài)擴縮容的場景郊愧，需要水平擴展服務(wù)的性能朴译，就需要在新增的服務(wù)上準備運行環(huán)境，部署服務(wù)等属铁，運維將變得十分困難

第十三次演進：引入容器化技術(shù)實現(xiàn)運行環(huán)境隔離與動態(tài)服務(wù)管理

目前最流行的容器化技術(shù)是Docker眠寿，最流行的容器管理服務(wù)是Kubernetes(K8S)，應(yīng)用/服務(wù)可以打包為Docker鏡像红选，通過K8S來動態(tài)分發(fā)和部署鏡像。Docker鏡像可理解為一個能運行你的應(yīng)用/服務(wù)的最小的操作系統(tǒng)姆另，里面放著應(yīng)用/服務(wù)的運行代碼喇肋，運行環(huán)境根據(jù)實際的需要設(shè)置好。把整個“操作系統(tǒng)”打包為一個鏡像后迹辐，就可以分發(fā)到需要部署相關(guān)服務(wù)的機器上蝶防，直接啟動Docker鏡像就可以把服務(wù)起起來，使服務(wù)的部署和運維變得簡單明吩。

在大促的之前间学，可以在現(xiàn)有的機器集群上劃分出服務(wù)器來啟動Docker鏡像，增強服務(wù)的性能印荔，大促過后就可以關(guān)閉鏡像低葫，對機器上的其他服務(wù)不造成影響（在3.14節(jié)之前，服務(wù)運行在新增機器上需要修改系統(tǒng)配置來適配服務(wù)仍律，這會導致機器上其他服務(wù)需要的運行環(huán)境被破壞）嘿悬。

使用容器化技術(shù)后服務(wù)動態(tài)擴縮容問題得以解決，但是機器還是需要公司自身來管理水泉，在非大促的時候善涨，還是需要閑置著大量的機器資源來應(yīng)對大促，機器自身成本和運維成本都極高草则，資源利用率低

第十四次演進：以云平臺承載系統(tǒng)

系統(tǒng)可部署到公有云上钢拧，利用公有云的海量機器資源，解決動態(tài)硬件資源的問題炕横，在大促的時間段里源内，在云平臺中臨時申請更多的資源，結(jié)合Docker和K8S來快速部署服務(wù)份殿，在大促結(jié)束后釋放資源姿锭，真正做到按需付費，資源利用率大大提高伯铣，同時大大降低了運維成本呻此。

所謂的云平臺，就是把海量機器資源腔寡，通過統(tǒng)一的資源管理焚鲜，抽象為一個資源整體，在之上可按需動態(tài)申請硬件資源（如CPU、內(nèi)存忿磅、網(wǎng)絡(luò)等）糯彬，并且之上提供通用的操作系統(tǒng)，提供常用的技術(shù)組件（如Hadoop技術(shù)棧葱她，MPP數(shù)據(jù)庫等）供用戶使用撩扒，甚至提供開發(fā)好的應(yīng)用，用戶不需要關(guān)系應(yīng)用內(nèi)部使用了什么技術(shù)吨些，就能夠解決需求（如音視頻轉(zhuǎn)碼服務(wù)搓谆、郵件服務(wù)、個人博客等）豪墅。在云平臺中會涉及如下幾個概念：

IaaS：基礎(chǔ)設(shè)施即服務(wù)泉手。對應(yīng)于上面所說的機器資源統(tǒng)一為資源整體，可動態(tài)申請硬件資源的層面偶器；

PaaS：平臺即服務(wù)斩萌。對應(yīng)于上面所說的提供常用的技術(shù)組件方便系統(tǒng)的開發(fā)和維護；

SaaS：軟件即服務(wù)屏轰。對應(yīng)于上面所說的提供開發(fā)好的應(yīng)用或服務(wù)颊郎，按功能或性能要求付費。

至此霎苗，以上所提到的從高并發(fā)訪問問題袭艺，到服務(wù)的架構(gòu)和系統(tǒng)實施的層面都有了各自的解決方案，但同時也應(yīng)該意識到叨粘，在上面的介紹中猾编，其實是有意忽略了諸如跨機房數(shù)據(jù)同步、分布式事務(wù)實現(xiàn)等等的實際問題升敲，這些問題以后有機會再拿出來單獨討論

4. 架構(gòu)設(shè)計總結(jié)

架構(gòu)的調(diào)整是否必須按照上述演變路徑進行答倡？

不是的，以上所說的架構(gòu)演變順序只是針對某個側(cè)面進行單獨的改進驴党，在實際場景中瘪撇，可能同一時間會有幾個問題需要解決，或者可能先達到瓶頸的是另外的方面港庄，這時候就應(yīng)該按照實際問題實際解決倔既。如在政府類的并發(fā)量可能不大，但業(yè)務(wù)可能很豐富的場景鹏氧，高并發(fā)就不是重點解決的問題渤涌，此時優(yōu)先需要的可能會是豐富需求的解決方案。

對于將要實施的系統(tǒng)把还，架構(gòu)應(yīng)該設(shè)計到什么程度实蓬？

對于單次實施并且性能指標明確的系統(tǒng)茸俭，架構(gòu)設(shè)計到能夠支持系統(tǒng)的性能指標要求就足夠了，但要留有擴展架構(gòu)的接口以便不備之需安皱。對于不斷發(fā)展的系統(tǒng)调鬓，如電商平臺，應(yīng)設(shè)計到能滿足下一階段用戶量和性能指標要求的程度酌伊，并根據(jù)業(yè)務(wù)的增長不斷的迭代升級架構(gòu)腾窝，以支持更高的并發(fā)和更豐富的業(yè)務(wù)。

服務(wù)端架構(gòu)和大數(shù)據(jù)架構(gòu)有什么區(qū)別居砖？

所謂的“大數(shù)據(jù)”其實是海量數(shù)據(jù)采集清洗轉(zhuǎn)換虹脯、數(shù)據(jù)存儲、數(shù)據(jù)分析悯蝉、數(shù)據(jù)服務(wù)等場景解決方案的一個統(tǒng)稱归形，在每一個場景都包含了多種可選的技術(shù)托慨，如數(shù)據(jù)采集有Flume鼻由、Sqoop、Kettle等厚棵，數(shù)據(jù)存儲有分布式文件系統(tǒng)HDFS蕉世、FastDFS，NoSQL數(shù)據(jù)庫HBase婆硬、MongoDB等狠轻，數(shù)據(jù)分析有Spark技術(shù)棧、機器學習算法等彬犯∠蚵ィ總的來說大數(shù)據(jù)架構(gòu)就是根據(jù)業(yè)務(wù)的需求，整合各種大數(shù)據(jù)組件組合而成的架構(gòu)谐区，一般會提供分布式存儲湖蜕、分布式計算、多維分析宋列、數(shù)據(jù)倉庫昭抒、機器學習算法等能力。而服務(wù)端架構(gòu)更多指的是應(yīng)用組織層面的架構(gòu)炼杖，底層能力往往是由大數(shù)據(jù)架構(gòu)來提供灭返。

有沒有一些架構(gòu)設(shè)計的原則？

N+1設(shè)計坤邪。系統(tǒng)中的每個組件都應(yīng)做到?jīng)]有單點故障熙含；

回滾設(shè)計。確保系統(tǒng)可以向前兼容艇纺，在系統(tǒng)升級時應(yīng)能有辦法回滾版本婆芦；

禁用設(shè)計怕磨。應(yīng)該提供控制具體功能是否可用的配置，在系統(tǒng)出現(xiàn)故障時能夠快速下線功能消约；

監(jiān)控設(shè)計肠鲫。在設(shè)計階段就要考慮監(jiān)控的手段；

多活數(shù)據(jù)中心設(shè)計或粮。若系統(tǒng)需要極高的高可用导饲，應(yīng)考慮在多地實施數(shù)據(jù)中心進行多活，至少在一個機房斷電的情況下系統(tǒng)依然可用氯材；

采用成熟的技術(shù)渣锦。剛開發(fā)的或開源的技術(shù)往往存在很多隱藏的bug，出了問題沒有商業(yè)支持可能會是一個災(zāi)難氢哮；

資源隔離設(shè)計袋毙。應(yīng)避免單一業(yè)務(wù)占用全部資源；

架構(gòu)應(yīng)能水平擴展冗尤。系統(tǒng)只有做到能水平擴展听盖，才能有效避免瓶頸問題；

非核心則購買裂七。非核心功能若需要占用大量的研發(fā)資源才能解決皆看，則考慮購買成熟的產(chǎn)品；

使用商用硬件背零。商用硬件能有效降低硬件故障的機率腰吟；

快速迭代。系統(tǒng)應(yīng)該快速開發(fā)小功能模塊徙瓶，盡快上線進行驗證毛雇，早日發(fā)現(xiàn)問題大大降低系統(tǒng)交付的風險；

無狀態(tài)設(shè)計侦镇。服務(wù)接口應(yīng)該做成無狀態(tài)的灵疮，當前接口的訪問不依賴于接口上次訪問的狀態(tài)。

最后編輯于：2020.09.11 12:06:38

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末虽缕，一起剝皮案震驚了整個濱河市始藕，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌氮趋，老刑警劉巖伍派，帶你破解...
沈念sama閱讀 217,734評論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異剩胁，居然都是意外死亡诉植，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,931評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門昵观，熙熙樓的掌柜王于貴愁眉苦臉地迎上來晾腔，“玉大人舌稀，你說我怎么就攤上這事∽评蓿” “怎么了壁查？”我有些...
開封第一講書人閱讀 164,133評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長剔应。經(jīng)常有香客問我睡腿，道長，這世上最難降的妖魔是什么峻贮？我笑而不...
開封第一講書人閱讀 58,532評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任席怪，我火速辦了婚禮，結(jié)果婚禮上纤控，老公的妹妹穿的比我還像新娘挂捻。我一直安慰自己，他們只是感情好船万，可當我...
茶點故事閱讀 67,585評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布刻撒。她就那樣靜靜地躺著，像睡著了一般唬涧。火紅的嫁衣襯著肌膚如雪疫赎。梳的紋絲不亂的頭發(fā)上盛撑，一...
開封第一講書人閱讀 51,462評論 1贊 302
城市分裂傳說
那天碎节，我揣著相機與錄音，去河邊找鬼抵卫。笑死狮荔，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的介粘。我是一名探鬼主播殖氏，決...
沈念sama閱讀 40,262評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼姻采！你這毒婦竟也來了雅采？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,153評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤慨亲，失蹤者是張志新（化名）和其女友劉穎婚瓜，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體刑棵，經(jīng)...
沈念sama閱讀 45,587評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡巴刻，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,792評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了蛉签。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片胡陪。...
茶點故事閱讀 39,919評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡沥寥，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出柠座，到底是詐尸還是另有隱情邑雅，我是刑警寧澤，帶...
沈念sama閱讀 35,635評論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布妈经，位于F島的核電站蒂阱，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏狂塘。R本人自食惡果不足惜录煤，卻給世界環(huán)境...
茶點故事閱讀 41,237評論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望荞胡。院中可真熱鬧妈踊，春花似錦、人聲如沸泪漂。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,855評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽萝勤。三九已至露筒，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間敌卓，已是汗流浹背慎式。一陣腳步聲響...
開封第一講書人閱讀 32,983評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留趟径，地道東北人瘪吏。一個月前我還...
沈念sama閱讀 48,048評論 3贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像蜗巧，于是被迫代替她去往敵國和親掌眠。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 44,864評論 2贊 354

[轉(zhuǎn)]服務(wù)端高并發(fā)分布式架構(gòu)演進之路

推薦閱讀更多精彩內(nèi)容