前言
一個(gè)成熟的大型網(wǎng)站(如淘寶、京東等)的系統(tǒng)架構(gòu)并不是開始設(shè)計(jì)就具備完整的高性能忍饰、高可用贪嫂、安全等特性,它總是隨著用戶量的增加艾蓝,業(yè)務(wù)功能的擴(kuò)展逐漸演變完善的力崇,在這個(gè)過(guò)程中,開發(fā)模式赢织、技術(shù)架構(gòu)亮靴、設(shè)計(jì)思想也發(fā)生了很大的變化,就連技術(shù)人員也從幾個(gè)人發(fā)展到一個(gè)部門甚至一條產(chǎn)品線于置。所以成熟的系統(tǒng)架構(gòu)是隨業(yè)務(wù)擴(kuò)展而完善出來(lái)的茧吊,并不是一蹴而就;不同業(yè)務(wù)特征的系統(tǒng)八毯,會(huì)有各自的側(cè)重點(diǎn)搓侄,例如淘寶,要解決海量的商品信息的搜索话速、下單讶踪、支付,例如騰訊泊交,要解決數(shù)億的用戶實(shí)時(shí)消息傳輸乳讥,百度它要處理海量的搜索請(qǐng)求柱查,他們都有各自的業(yè)務(wù)特性,系統(tǒng)架構(gòu)也有所不同雏婶。盡管如此我們也可以從這些不同的網(wǎng)站背景下物赶,找出其中共用的技術(shù),這些技術(shù)和手段可以廣泛運(yùn)行在大型網(wǎng)站系統(tǒng)的架構(gòu)中留晚,下面就通過(guò)介紹大型網(wǎng)站系統(tǒng)的演化過(guò)程酵紫,來(lái)認(rèn)識(shí)這些技術(shù)和手段。
一错维、最開始的網(wǎng)站架構(gòu)
最初的架構(gòu)奖地,應(yīng)用程序、數(shù)據(jù)庫(kù)赋焕、文件都部署在一臺(tái)服務(wù)器上参歹,如圖:
二、應(yīng)用隆判、數(shù)據(jù)犬庇、文件分離
隨著業(yè)務(wù)的擴(kuò)展,一臺(tái)服務(wù)器已經(jīng)不能滿足性能需求侨嘀,故將應(yīng)用程序臭挽、數(shù)據(jù)庫(kù)、文件各自部署在獨(dú)立的服務(wù)器上咬腕,并且根據(jù)服務(wù)器的用途配置不同的硬件欢峰,達(dá)到最佳的性能效果。
三涨共、利用緩存改善網(wǎng)站性能
在硬件優(yōu)化性能的同時(shí)纽帖,同時(shí)也通過(guò)軟件進(jìn)行性能優(yōu)化,在大部分的網(wǎng)站系統(tǒng)中举反,都會(huì)利用緩存技術(shù)改善系統(tǒng)的性能懊直,使用緩存主要源于熱點(diǎn)數(shù)據(jù)的存在,大部分網(wǎng)站訪問(wèn)都遵循28原則(即80%的訪問(wèn)請(qǐng)求照筑,最終落在20%的數(shù)據(jù)上)吹截,所以我們可以對(duì)熱點(diǎn)數(shù)據(jù)進(jìn)行緩存,減少這些數(shù)據(jù)的訪問(wèn)路徑凝危,提高用戶體驗(yàn)。
緩存實(shí)現(xiàn)常見的方式是本地緩存晨逝、分布式緩存蛾默。當(dāng)然還有CDN、反向代理等捉貌,這個(gè)后面再講支鸡。本地緩存冬念,顧名思義是將數(shù)據(jù)緩存在應(yīng)用服務(wù)器本地,可以存在內(nèi)存中牧挣,也可以存在文件急前,OSCache就是常用的本地緩存組件。本地緩存的特點(diǎn)是速度快瀑构,但因?yàn)楸镜乜臻g有限所以緩存數(shù)據(jù)量也有限裆针。分布式緩存的特點(diǎn)是,可以緩存海量的數(shù)據(jù)寺晌,并且擴(kuò)展非常容易世吨,在門戶類網(wǎng)站中常常被使用,速度按理沒(méi)有本地緩存快呻征,常用的分布式緩存是Membercache耘婚、Redis。
四陆赋、使用集群改善應(yīng)用服務(wù)器性能
應(yīng)用服務(wù)器作為網(wǎng)站的入口沐祷,會(huì)承擔(dān)大量的請(qǐng)求,我們往往通過(guò)應(yīng)用服務(wù)器集群來(lái)分擔(dān)請(qǐng)求數(shù)攒岛。應(yīng)用服務(wù)器前面部署負(fù)載均衡服務(wù)器調(diào)度用戶請(qǐng)求赖临,根據(jù)分發(fā)策略將請(qǐng)求分發(fā)到多個(gè)應(yīng)用服務(wù)器節(jié)點(diǎn)。
常用的負(fù)載均衡技術(shù)硬件的有F5阵子,價(jià)格比較貴思杯,軟件的有LVS、Nginx挠进、HAProxy色乾。LVS是四層負(fù)載均衡,根據(jù)目標(biāo)地址和端口選擇內(nèi)部服務(wù)器领突,Nginx和HAProxy是七層負(fù)載均衡暖璧,可以根據(jù)報(bào)文內(nèi)容選擇內(nèi)部服務(wù)器,因此LVS分發(fā)路徑優(yōu)于Nginx和HAProxy君旦,性能要高些澎办,而Nginx和HAProxy則更具配置性,如可以用來(lái)做動(dòng)靜分離(根據(jù)請(qǐng)求報(bào)文特征金砍,選擇靜態(tài)資源服務(wù)器還是應(yīng)用服務(wù)器)局蚀。
五、數(shù)據(jù)庫(kù)讀寫分離和分庫(kù)分表
隨著用戶量的增加恕稠,數(shù)據(jù)庫(kù)成為最大的瓶頸琅绅,改善數(shù)據(jù)庫(kù)性能常用的手段是進(jìn)行讀寫分離以及分表,讀寫分離顧名思義就是將數(shù)據(jù)庫(kù)分為讀庫(kù)和寫庫(kù)鹅巍,通過(guò)主備功能實(shí)現(xiàn)數(shù)據(jù)同步千扶。分庫(kù)分表則分為水平切分和垂直切分料祠,水平切換則是對(duì)一個(gè)數(shù)據(jù)庫(kù)特大的表進(jìn)行拆分,例如用戶表澎羞。垂直切分則是根據(jù)業(yè)務(wù)不同來(lái)切換髓绽,如用戶業(yè)務(wù)、商品業(yè)務(wù)相關(guān)的表放在不同的數(shù)據(jù)庫(kù)中妆绞。
六顺呕、使用CDN和反向代理提高網(wǎng)站性能
假如我們的服務(wù)器都部署在成都的機(jī)房,對(duì)于四川的用戶來(lái)說(shuō)訪問(wèn)是較快的摆碉,而對(duì)于北京的用戶訪問(wèn)是較慢的塘匣,這是由于四川和北京分別屬于電信和聯(lián)通的不同發(fā)達(dá)地區(qū),北京用戶訪問(wèn)需要通過(guò)互聯(lián)路由器經(jīng)過(guò)較長(zhǎng)的路徑才能訪問(wèn)到成都的服務(wù)器巷帝,返回路徑也一樣忌卤,所以數(shù)據(jù)傳輸時(shí)間比較長(zhǎng)。對(duì)于這種情況楞泼,常常使用CDN解決驰徊,CDN將數(shù)據(jù)內(nèi)容緩存到運(yùn)營(yíng)商的機(jī)房,用戶訪問(wèn)時(shí)先從最近的運(yùn)營(yíng)商獲取數(shù)據(jù)堕阔,這樣大大減少了網(wǎng)絡(luò)訪問(wèn)的路徑棍厂。比較專業(yè)的CDN運(yùn)營(yíng)商有藍(lán)汛、網(wǎng)宿超陆。
而反向代理牺弹,則是部署在網(wǎng)站的機(jī)房,當(dāng)用戶請(qǐng)求達(dá)到時(shí)首先訪問(wèn)反向代理服務(wù)器时呀,反向代理服務(wù)器將緩存的數(shù)據(jù)返回給用戶张漂,如果沒(méi)有沒(méi)有緩存數(shù)據(jù)才會(huì)繼續(xù)走應(yīng)用服務(wù)器獲取,也減少了獲取數(shù)據(jù)的成本谨娜。反向代理有Squid航攒,Nginx。
七趴梢、使用分布式文件系統(tǒng)
用戶一天天增加漠畜,業(yè)務(wù)量越來(lái)越大,產(chǎn)生的文件越來(lái)越多坞靶,單臺(tái)的文件服務(wù)器已經(jīng)不能滿足需求憔狞。需要分布式的文件系統(tǒng)支撐。常用的分布式文件系統(tǒng)有NFS彰阴。
八躯喇、使用NoSql和搜索引擎
對(duì)于海量數(shù)據(jù)的查詢,我們使用nosql數(shù)據(jù)庫(kù)加上搜索引擎可以達(dá)到更好的性能硝枉。并不是所有的數(shù)據(jù)都要放在關(guān)系型數(shù)據(jù)中廉丽。常用的NOSQL有mongodb和redis,搜索引擎有l(wèi)ucene妻味。
九正压、將應(yīng)用服務(wù)器進(jìn)行業(yè)務(wù)拆分
隨著業(yè)務(wù)進(jìn)一步擴(kuò)展,應(yīng)用程序變得非常臃腫责球,這時(shí)我們需要將應(yīng)用程序進(jìn)行業(yè)務(wù)拆分焦履,如百度分為新聞、網(wǎng)頁(yè)雏逾、圖片等業(yè)務(wù)嘉裤。每個(gè)業(yè)務(wù)應(yīng)用負(fù)責(zé)相對(duì)獨(dú)立的業(yè)務(wù)運(yùn)作。業(yè)務(wù)之間通過(guò)消息進(jìn)行通信或者同享數(shù)據(jù)庫(kù)來(lái)實(shí)現(xiàn)栖博。
十屑宠、搭建分布式服務(wù)
這時(shí)我們發(fā)現(xiàn)各個(gè)業(yè)務(wù)應(yīng)用都會(huì)使用到一些基本的業(yè)務(wù)服務(wù),例如用戶服務(wù)仇让、訂單服務(wù)典奉、支付服務(wù)、安全服務(wù)丧叽,這些服務(wù)是支撐各業(yè)務(wù)應(yīng)用的基本要素卫玖。我們將這些服務(wù)抽取出來(lái)利用分部式服務(wù)框架搭建分布式服務(wù)。淘寶的Dubbo是一個(gè)不錯(cuò)的選擇踊淳。
小結(jié)
大型網(wǎng)站的架構(gòu)是根據(jù)業(yè)務(wù)需求不斷完善的假瞬,根據(jù)不同的業(yè)務(wù)特征會(huì)做特定的設(shè)計(jì)和考慮,本文只是講述一個(gè)常規(guī)大型網(wǎng)站會(huì)涉及的一些技術(shù)和手段迂尝。