【轉(zhuǎn)】緩存在分布式系統(tǒng)中的應(yīng)用
緩存在分布式系統(tǒng)中的應(yīng)用
摘要
緩存是分布式系統(tǒng)中的重要組件,主要解決高并發(fā)镀层,大數(shù)據(jù)場景下嘉汰,熱點數(shù)據(jù)訪問的性能問題。提供高性能的數(shù)據(jù)快速訪問摩疑。
本文是緩存在分布式應(yīng)用第一篇文章危融,介紹緩存的原理,緩存的分類雷袋,緩存的設(shè)計吉殃,CDN緩存(原理,架構(gòu)參考和技術(shù)實踐),反向代理緩存(原理蛋勺,Squid架構(gòu)實踐和常用代理緩存之間的比較)等瓦灶。
目錄
緩存概述
CDN緩存
反向代理緩存
分布式緩存
本地緩存
緩存架構(gòu)示例
1. 緩存概述
緩存是分布式系統(tǒng)中的重要組件,主要解決高并發(fā)抱完,大數(shù)據(jù)場景下贼陶,熱點數(shù)據(jù)訪問的性能問題。提供高性能的數(shù)據(jù)快速訪問巧娱。
1.1 緩存原理
將數(shù)據(jù)寫入/讀取速度更快的存儲(設(shè)備)碉怔;
將數(shù)據(jù)緩存到離應(yīng)用最近的位置;
將數(shù)據(jù)緩存到離用戶最近的位置禁添。
1.2 緩存分類
在分布式系統(tǒng)中撮胧,緩存的應(yīng)用非常廣泛,從部署角度有以下幾個方面的緩存應(yīng)用上荡。
CDN緩存趴樱;
反向代理緩存;
分布式Cache酪捡;
本地應(yīng)用緩存叁征;
1.3 緩存媒介
常用中間件:Varnish,Ngnix逛薇,Squid捺疼,Memcache,Redis永罚,Ehcache等啤呼;
緩存的內(nèi)容:文件,數(shù)據(jù)呢袱,對象官扣;
緩存的介質(zhì):CPU,內(nèi)存(本地羞福,分布式)惕蹄,磁盤(本地,分布式)
1.4 緩存設(shè)計
緩存設(shè)計需要解決以下幾個問題:
(1)緩存什么治专?? 哪些數(shù)據(jù)需要緩存:1.熱點數(shù)據(jù)卖陵;2.靜態(tài)資源;(2)緩存的位置张峰?? CDN泪蔫,反向代理,分布式緩存服務(wù)器喘批,本機(內(nèi)存撩荣,硬盤)(3)如何緩存的問題铣揉?? - 過期策略1.固定時間:比如指定緩存的時間是30分鐘;2.相對時間:比如最近10分鐘內(nèi)沒有訪問的數(shù)據(jù)婿滓;? - 同步機制1.實時寫入(PUSH)2.異步刷新(PUSH & PULL)
2. CDN緩存
CDN主要解決將數(shù)據(jù)緩存到離用戶最近的位置老速,一般緩存靜態(tài)資源文件(頁面,腳本凸主,圖片橘券,視頻,文件等)卿吐。國內(nèi)網(wǎng)絡(luò)異常復(fù)雜旁舰,跨運營商的網(wǎng)絡(luò)訪問會很慢。為了解決跨運營商或各地用戶訪問問題嗡官,可以在重要的城市箭窜,部署CDN應(yīng)用。使用戶就近獲取所需內(nèi)容衍腥,降低網(wǎng)絡(luò)擁塞磺樱,提高用戶訪問響應(yīng)速度和命中率。
2.1 CDN原理
CDN的基本原理是廣泛采用各種緩存服務(wù)器婆咸,將這些緩存服務(wù)器分布到用戶訪問相對集中的地區(qū)或網(wǎng)絡(luò)中竹捉,在用戶訪問網(wǎng)站時,利用全局負(fù)載技術(shù)將用戶的訪問指向距離最近的工作正常的緩存服務(wù)器上尚骄,由緩存服務(wù)器直接響應(yīng)用戶請求块差。
未部署CDN應(yīng)用前
未部署CDN應(yīng)用前應(yīng)用架構(gòu)
網(wǎng)絡(luò)路徑:
請求:本機網(wǎng)絡(luò)(局域網(wǎng))--> 運營商網(wǎng)絡(luò) --> 應(yīng)用服務(wù)器機房
響應(yīng):應(yīng)用服務(wù)器機房 --> 運營商網(wǎng)絡(luò) --> 本機網(wǎng)絡(luò)(局域網(wǎng))
在不考慮復(fù)雜網(wǎng)絡(luò)的情況下,從請求到響應(yīng)需要經(jīng)過3個節(jié)點倔丈,6個步驟完成一次用戶訪問操作憨闰。
部署CDN應(yīng)用后
網(wǎng)絡(luò)路徑:
請求:本機網(wǎng)絡(luò)(局域網(wǎng))--> 運營商網(wǎng)絡(luò)
響應(yīng):運營商網(wǎng)絡(luò) --> 本機網(wǎng)絡(luò)(局域網(wǎng))
在不考慮復(fù)雜網(wǎng)絡(luò)的情況下,從請求到響應(yīng)需要經(jīng)過2個節(jié)點需五,2個步驟完成一次用戶訪問操作鹉动。
與不部署CDN服務(wù)相比,減少了1個節(jié)點宏邮,4個步驟的訪問泽示。極大的提高的系統(tǒng)的響應(yīng)速度。
2.2 CDN優(yōu)缺點
優(yōu)點
本地Cache加速:提升訪問速度蜀铲,尤其含有大量圖片和靜態(tài)頁面站點边琉;
鏡像服務(wù):消除了不同運營商之間互聯(lián)的瓶頸造成的影響属百,實現(xiàn)了跨運營商的網(wǎng)絡(luò)加速记劝,保證不同網(wǎng)絡(luò)中的用戶都能得到良好的訪問質(zhì)量;
遠(yuǎn)程加速:遠(yuǎn)程訪問用戶根據(jù)DNS負(fù)載均衡技術(shù)智能自動選擇Cache服務(wù)器族扰,選擇最快的Cache服務(wù)器厌丑,加快遠(yuǎn)程訪問的速度定欧;
帶寬優(yōu)化:自動生成服務(wù)器的遠(yuǎn)程Mirror(鏡像)cache服務(wù)器,遠(yuǎn)程用戶訪問時從cache服務(wù)器上讀取數(shù)據(jù)怒竿,減少遠(yuǎn)程訪問的帶寬砍鸠、分擔(dān)網(wǎng)絡(luò)流量、減輕原站點WEB服務(wù)器負(fù)載等功能耕驰。
集群抗攻擊:廣泛分布的CDN節(jié)點加上節(jié)點之間的智能冗余機制爷辱,可以有效地預(yù)防黑客入侵以及降低各種D.D.o.S攻擊對網(wǎng)站的影響,同時保證較好的服務(wù)質(zhì)量朦肘。
缺點
動態(tài)資源緩存饭弓,需要注意實時性;
解決辦法:主要緩存靜態(tài)資源媒抠,動態(tài)資源建立多級緩存或準(zhǔn)實時同步等弟断。
如何保證數(shù)據(jù)的一致性和實時性需要權(quán)衡考慮。
解決辦法:設(shè)置緩存失效時間趴生;數(shù)據(jù)版本號等阀趴。
2.3 CDN架構(gòu)參考
CDN架構(gòu)參考
2.4 CDN技術(shù)實踐
目前,中小型互聯(lián)網(wǎng)公司苍匆,綜合成本考慮刘急,一般租用第三方CDN服務(wù),大型互聯(lián)網(wǎng)公司锉桑,采用自建或第三方結(jié)合的方式排霉。比如淘寶剛開始使用第三方的,當(dāng)流量很大后民轴,第三方公司無法支撐其CDN流量攻柠,淘寶最后采用自建CDN的方式實現(xiàn)。
例如淘寶的CDN架構(gòu)后裸,如下圖所示:
淘寶CDN架構(gòu)
3. 反向代理緩存
反向代理是指在網(wǎng)站服務(wù)器機房部署代理服務(wù)器瑰钮,實現(xiàn)負(fù)載均衡,數(shù)據(jù)緩存微驶,安全控制等功能浪谴。
3.1 反射代理緩存原理
反向代理位于應(yīng)用服務(wù)器機房,處理所有對WEB服務(wù)器的請求因苹。如果用戶請求的頁面在代理服務(wù)器上有緩沖的話苟耻,代理服務(wù)器直接將緩沖內(nèi)容發(fā)送給用戶。如果沒有緩沖則先向WEB服務(wù)器發(fā)出請求扶檐,取回數(shù)據(jù)凶杖,本地緩存后再發(fā)送給用戶。通過降低向WEB服務(wù)器的請求數(shù)款筑,從而降低了WEB服務(wù)器的負(fù)載智蝠。
反射代理緩存原理
反向代理一般緩存靜態(tài)資源腾么,動態(tài)資源轉(zhuǎn)發(fā)到應(yīng)用服務(wù)器處理。常用的緩存應(yīng)用服務(wù)器有Varnish杈湾,Ngnix解虱,Squid。
3.2 SQUID反向代理示例
Squid 反向代理一般只緩存靜態(tài)資源漆撞,動態(tài)程序默認(rèn)不緩存殴泰。根據(jù)從 WEB 服務(wù)器返回的 HTTP 頭標(biāo)記來緩沖靜態(tài)頁面。有四個最重要 HTTP 頭標(biāo)記:
Last-Modified: 告訴反向代理頁面什么時間被修改
Expires: 告訴反向代理頁面什么時間應(yīng)該從緩沖區(qū)中刪除
Cache-Control: 告訴反向代理頁面是否應(yīng)該被緩沖
Pragma: 用來包含實現(xiàn)特定的指令浮驳,最常用的是 Pragma:no-cache
image
Squid 反向代理加速網(wǎng)站實例
通過DNS的輪詢技術(shù)艰匙,將客戶端的請求分發(fā)給其中一臺 Squid 反向代理服務(wù)器處理;
如果這臺 Squid 緩存了用戶的請求資源抹恳,則將請求的資源直接返回給用戶员凝;
否則這臺 Squid 將沒有緩存的請求根據(jù)配置的規(guī)則發(fā)送給鄰居 Squid 和后臺的 WEB 服務(wù)器處理;
這樣既減輕后臺 WEB 服務(wù)器的負(fù)載奋献,又提高整個網(wǎng)站的性能和安全性健霹。
3.3 代理緩存比較
常用的代理緩存有Varnish,Squid瓶蚂,Ngnix糖埋,簡單比較如下:
(1)varnish和squid是專業(yè)的cache服務(wù),nginx需要第三方模塊支持窃这;(2)Varnish采用內(nèi)存型緩存瞳别,避免了頻繁在內(nèi)存、磁盤中交換文件杭攻,性能比Squid高祟敛;(3)Varnish由于是內(nèi)存cache,所以對小文件如css,js,小圖片啥的支持很棒兆解,后端的持久化緩存可以采用的是Squid或ATS馆铁;(4)Squid功能全而大,適合于各種靜態(tài)的文件緩存锅睛,一般會在前端掛一個HAProxy或nginx做負(fù)載均衡跑多個實例埠巨;(5)Nginx采用第三方模塊ncache做的緩沖,性能基本達(dá)到varnish现拒,一般作為反向代理使用辣垒,可以實現(xiàn)簡單的緩存。
4. 分布式緩存
CDN緩存印蔬、反向代理緩存勋桶,主要解決靜態(tài)文件,或用戶請求資源的緩存,數(shù)據(jù)源一般為靜態(tài)文件或動態(tài)生成的文件(有緩存頭標(biāo)識)哥遮。
分布式緩存,主要指緩存用戶經(jīng)常訪問數(shù)據(jù)的緩存陵究,數(shù)據(jù)源為數(shù)據(jù)庫眠饮。一般起到熱點數(shù)據(jù)訪問和減輕數(shù)據(jù)庫壓力的作用。
目前分布式緩存設(shè)計铜邮,在大型網(wǎng)站架構(gòu)中是必備的架構(gòu)要素仪召。常用的中間件有Memcached、Redis松蒜。
4.1 Memcached緩存
Memcache是一個高性能扔茅,分布式內(nèi)存對象緩存系統(tǒng),通過在內(nèi)存里維護一個統(tǒng)一的巨大的hash表秸苗,它能夠用來存儲各種格式的數(shù)據(jù)召娜,包括圖像、視頻惊楼、文件以及數(shù)據(jù)庫檢索的結(jié)果等玖瘸。簡單的說就是將數(shù)據(jù)調(diào)用到內(nèi)存中,然后從內(nèi)存中讀取檀咙,從而大大提高讀取速度雅倒。
Memcache特性:
(1)使用物理內(nèi)存作為緩存區(qū),可獨立運行在服務(wù)器上弧可。每個進程最大2G蔑匣,如果想緩存更多的數(shù)據(jù),可以開辟更多的memcache進程(不同端口)或者使用分布式memcache進行緩存棕诵,將數(shù)據(jù)緩存到不同的物理機或者虛擬機上裁良。(2)使用key-value的方式來存儲數(shù)據(jù),這是一種單索引的結(jié)構(gòu)化數(shù)據(jù)組織形式校套,可使數(shù)據(jù)項查詢時間復(fù)雜度為O(1)趴久。(3)協(xié)議簡單:基于文本行的協(xié)議,直接通過telnet在memcached服務(wù)器上可進行存取操作搔确,簡單彼棍,方便多種緩存參考此協(xié)議;(4)基于libevent高性能通信:Libevent是一套利用C開發(fā)的程序庫膳算,它將BSD系統(tǒng)的kqueue,Linux系統(tǒng)的epoll等事件處理功能封裝成一個接口座硕,與傳統(tǒng)的select相比,提高了性能涕蜂。(5)內(nèi)置的內(nèi)存管理方式:所有數(shù)據(jù)都保存在內(nèi)存中华匾,存取數(shù)據(jù)比硬盤快,當(dāng)內(nèi)存滿后,通過LRU算法自動刪除不使用的緩存蜘拉,但沒有考慮數(shù)據(jù)的容災(zāi)問題萨西,重啟服務(wù),所有數(shù)據(jù)會丟失旭旭。(6)分布式:各個memcached服務(wù)器之間互不通信谎脯,各自獨立存取數(shù)據(jù),不共享任何信息持寄。服務(wù)器并不具有分布式功能源梭,分布式部署取決于memcache客戶端。(7)緩存策略:Memcached的緩存策略是LRU(最近最少使用)到期失效策略稍味。在memcached內(nèi)存儲數(shù)據(jù)項時废麻,可以指定它在緩存的失效時間,默認(rèn)為永久模庐。當(dāng)memcached服務(wù)器用完分配的內(nèi)時烛愧,失效的數(shù)據(jù)被首先替換,然后也是最近未使用的數(shù)據(jù)掂碱。在LRU中屑彻,memcached使用的是一種Lazy Expiration策略,自己不會監(jiān)控存入的key/vlue對是否過期顶吮,而是在獲取key值時查看記錄的時間戳社牲,檢查key/value對空間是否過期,這樣可減輕服務(wù)器的負(fù)載悴了。
4.1.1 Memcached原理
Memcached工作流程
MemCached的工作流程如下:
(1)先檢查客戶端的請求數(shù)據(jù)是否在Memcached中搏恤,如有,直接把請求數(shù)據(jù)返回湃交,不再對數(shù)據(jù)庫進行任何操作熟空;(2)如果請求的數(shù)據(jù)不在Memcached中,就去查數(shù)據(jù)庫搞莺,把從數(shù)據(jù)庫中獲取的數(shù)據(jù)返回給客戶端息罗,同時把數(shù)據(jù)緩存一份到memcached中(Memcached客戶端不負(fù)責(zé),需要程序?qū)崿F(xiàn))才沧;(3)每次更新數(shù)據(jù)庫的同時更新Memcached中的數(shù)據(jù)迈喉,保證一致性;(4)當(dāng)分配給Memcached內(nèi)存空間用完之后温圆,會使用LRU(Least Recently Used挨摸,最近最少使用)策略加上到期失效策略,失效數(shù)據(jù)首先被替換岁歉,然后再替換掉最近未使用的數(shù)據(jù)得运。
4.1.2 Memcached集群
Memcached 雖然稱為 “ 分布式 ” 緩存服務(wù)器,但服務(wù)器端并沒有 “ 分布式 ” 功能。每個服務(wù)器都是完全獨立和隔離的服務(wù)熔掺。 memcached 的分布式饱搏,是由客戶端程序?qū)崿F(xiàn)的。
當(dāng)向Memcached集群存入/取出key value時置逻,memcached客戶端程序根據(jù)一定的算法計算存入哪臺服務(wù)器推沸,然后再把key value值存到此服務(wù)器中。
因此诽偷,存取數(shù)據(jù)分二步走:
第一步,選擇服務(wù)器疯坤;
第二步报慕,存取數(shù)據(jù)。
Memcached存取數(shù)據(jù)
分布式算法
選擇服務(wù)器算法有兩種压怠,一種是根據(jù)余數(shù)來計算分布眠冈,另一種是根據(jù)散列算法來計算分布。
余數(shù)算法:
先求得鍵的整數(shù)散列值菌瘫,再除以服務(wù)器臺數(shù)蜗顽,根據(jù)余數(shù)確定存取服務(wù)器。
優(yōu)點:計算簡單雨让,高效雇盖;
缺點:在memcached服務(wù)器增加或減少時,幾乎所有的緩存都會失效栖忠。
散列算法(一致性Hash):
先算出memcached服務(wù)器的散列值崔挖,并將其分布到0到2的32次方的圓上,然后用同樣的方法算出存儲數(shù)據(jù)的鍵的散列值并映射至圓上庵寞,最后從數(shù)據(jù)映射到的位置開始順時針查找狸相,將數(shù)據(jù)保存到查找到的第一個服務(wù)器上,如果超過2的32次方捐川,依然找不到服務(wù)器脓鹃,就將數(shù)據(jù)保存到第一臺memcached服務(wù)器上。
散列算法
如果添加了一臺memcached服務(wù)器古沥,只在圓上增加服務(wù)器的逆時針方向的第一臺服務(wù)器上的鍵會受到影響瘸右。
一致性Hash算法:解決了余數(shù)算法增加節(jié)點命中大幅額度降低的問題,理論上岩齿,插入一個實體節(jié)點尊浓,平均會影響到:虛擬節(jié)點數(shù)/2 的節(jié)點數(shù)據(jù)的命中。
4.2 Redis緩存
Redis 是一個開源(BSD許可)的纯衍,基于內(nèi)存的栋齿,多數(shù)據(jù)結(jié)構(gòu)存儲系統(tǒng)。可以用作數(shù)據(jù)庫瓦堵、緩存和消息中間件基协。 支持多種類型的數(shù)據(jù)結(jié)構(gòu),如 字符串(strings)菇用, 散列(hashes)澜驮, 列表(lists), 集合(sets)惋鸥, 有序集合(sorted sets) 與范圍查詢杂穷, bitmaps, hyperloglogs 和 地理空間(geospatial) 索引半徑查詢卦绣。
內(nèi)置了復(fù)制(replication)耐量,LUA腳本(Lua scripting), LRU驅(qū)動事件(LRU eviction)滤港,事務(wù)(transactions) 和不同級別的 磁盤持久化(persistence)廊蜒, 并通過 Redis哨兵(Sentinel)和自動分區(qū)(Cluster)提供高可用性(high availability)。
4.2.1 Redis常用數(shù)據(jù)類型
String類型
常用命令:set,get,decr,incr,mget
應(yīng)用場景:String是最常用的一種數(shù)據(jù)類型溅漾,與Memcache的key value存儲方式類似山叮。
實現(xiàn)方式:String在redis內(nèi)部存儲默認(rèn)就是一個字符串,被redisObject所引用添履,當(dāng)遇到incr,decr等操作時會轉(zhuǎn)成數(shù)值型進行計算屁倔,此時redisObject的encoding字段為int。
Hash類型
常用命令:hget,hset,hgetall
應(yīng)用場景:以存儲一個用戶信息對象數(shù)據(jù)為例:
image
實現(xiàn)方式:Hash類型對應(yīng)的Value暮胧,內(nèi)部實際就是一個HashMap汰现,實際這里會有2種不同實現(xiàn)。
Hash的成員比較少時Redis為了節(jié)省內(nèi)存會采用類似一維數(shù) 組的方式來緊湊存儲叔壤,而不會采用真正的HashMap結(jié)構(gòu)瞎饲,對應(yīng)的value redisObject的encoding為zipmap;
當(dāng)成員數(shù)量增大時會自動轉(zhuǎn)成真正的HashMap,此時encoding為ht炼绘。
List類型
常用命令:lpush,rpush,lpop,rpop,lrange
應(yīng)用場景:List類型的應(yīng)用場景非常多嗅战,也是Redis最重要的數(shù)據(jù)結(jié)構(gòu)之一,比如twitter的關(guān)注列表俺亮,粉絲列表等都可以用Redis的list結(jié)構(gòu)來實現(xiàn)驮捍。
實現(xiàn)方式:List的實現(xiàn)為一個雙向鏈表,可以支持反向查找和遍歷脚曾,方便操作东且。不過帶來了部分額外的內(nèi)存開銷,Redis內(nèi)部的很多實現(xiàn)本讥,包括發(fā)送緩沖隊列等也都是用的這個數(shù)據(jù)結(jié)構(gòu)珊泳。
Set類型
常用命令:sadd,spop,smembers,sunion
應(yīng)用場景:Set類型對外提供的功能與list類似是一個列表的功能鲁冯,特殊之處在于set是可以自動排重的,當(dāng)你需要存儲一個列表數(shù)據(jù)色查,又不希望出現(xiàn)重復(fù)數(shù)據(jù)時薯演,set 是一個很好的選擇,并且set提供了判斷某個成員是否在一個set集合內(nèi)的重要接口秧了,這個也是list所不能提供的跨扮。
實現(xiàn)方式:Set類型的內(nèi)部實現(xiàn)是一個value永遠(yuǎn)為null的HashMap,實際就是通過計算hash的方式來快速排重的验毡,這也是set能提供判斷一個成員是否在集合內(nèi)的原因衡创。
Sorted Set類型
常用命令:zadd,zrange,zrem,zcard;
使用場景:Sorted Set的使用場景與set類似晶通,區(qū)別是set不是自動有序的璃氢,而sorted set可以通過用戶額外提供一個優(yōu)先級(score)的參數(shù)來為成員排序,并且是插入有序的录择,即自動排序拔莱。當(dāng)你需要一個有序的并且不重復(fù)的集合列表碗降,可以選擇sorted set數(shù)據(jù)結(jié)構(gòu)隘竭,比如twitter 的public timeline可以以發(fā)表時間作為score來存儲,這樣獲取時就是自動按時間排好序的讼渊。
實現(xiàn)方式:Sorted set的內(nèi)部使用HashMap和跳躍表(SkipList)來保證數(shù)據(jù)的存儲和有序动看,HashMap里放的是成員到score的映射,而跳躍表里存放的 是所有的成員爪幻,排序依據(jù)是HashMap里存的score,使用跳躍表的結(jié)構(gòu)可以獲得比較高的查找效率菱皆,并且在實現(xiàn)上比較簡單。
4.2.2 Redis集群
通過KeepAlived實現(xiàn)的高可用方案
通過KeepAlived實現(xiàn)的高可用方案
- 切換流程:1.當(dāng)Master掛了后挨稿,VIP漂移到Slave仇轻;Slave 上keepalived 通知redis 執(zhí)行:slave of no one, 開始提供業(yè)務(wù)2.當(dāng)Master起來后,VIP 地址不變奶甘,Master的keepalived通知redis執(zhí)行slave of slave IP host篷店,開始作為從同步數(shù)據(jù)3.依次類推- 主從同時宕機情況:1.非計劃性,不做考慮臭家,一般也不會存在這種問題2.計劃性重啟疲陕,重啟之前通過運維手段SAVE DUMP 主庫數(shù)據(jù);需要注意順序:1). 關(guān)閉其中一臺機器上所有redis钉赁,是得master全部切到另外一臺機器(多實例部署蹄殃,單機上既有主又有從的情況);并關(guān)閉機器2). 依次dump主上redis服務(wù)3). 關(guān)閉主庫4). 啟動主庫你踩,并等待數(shù)據(jù)load完畢5). 啟動從庫6). 刪除DUMP文件(避免重啟加載慢)
使用Twemproxy實現(xiàn)集群方案
Twemproxy由Twitter公司開源的c版本proxy诅岩,同時支持memcached和redis讳苦,Twitter用它主要減少前端與緩存服務(wù)間網(wǎng)絡(luò)連接數(shù)。
Twemproxy方案的特點:快速按厘、輕量級医吊、減少后端Cache Server連接數(shù)、易配置逮京、支持ketama卿堂、modula、random懒棉、常用hash分片算法等草描。
Twemproxy集群方案
注:圖中使用Keepalived實現(xiàn)高可用主備方案,解決proxy單點問題策严。
Twemproxy方案的優(yōu)點:
對于客戶端而言穗慕,redis集群是透明的,客戶端簡單妻导,遍于動態(tài)擴容
Proxy為單點逛绵、處理一致性hash時,集群節(jié)點可用性檢測不存在腦裂問題
高性能倔韭,CPU密集型术浪,而redis節(jié)點集群多CPU資源冗余,可部署在redis節(jié)點集群上寿酌,不需要額外設(shè)備
4.3 Memcached與Redis的比較
數(shù)據(jù)結(jié)構(gòu):Memcache只支持key value存儲方式胰苏,Redis支持更多的數(shù)據(jù)類型,比如Key value醇疼,hash硕并,list,set秧荆,zset倔毙;
多線程:Memcache支持多線程,redis支持單線程乙濒;CPU利用方面Memcache優(yōu)于redis陕赃;
持久化:Memcache不支持持久化,Redis支持持久化琉兜;
內(nèi)存利用率:memcache高凯正,redis低(采用壓縮的情況下比memcache高);
過期策略:memcache過期后豌蟋,不刪除緩存廊散,會導(dǎo)致下次取數(shù)據(jù)數(shù)據(jù)的問題,Redis有專門線程梧疲,清除緩存數(shù)據(jù)允睹。
5. 本地緩存
本地緩存是指應(yīng)用內(nèi)部的緩存运准,標(biāo)準(zhǔn)的分布式系統(tǒng),一般有多級緩存構(gòu)成缭受。本地緩存是離應(yīng)用最近的緩存胁澳,一般可以將數(shù)據(jù)緩存到硬盤或內(nèi)存。
硬盤緩存
將數(shù)據(jù)緩存到硬盤到米者,讀取時從硬盤讀取韭畸。原理是直接讀取本機文件,減少了網(wǎng)絡(luò)傳輸消耗蔓搞,比通過網(wǎng)絡(luò)讀取數(shù)據(jù)庫速度更快胰丁。可以應(yīng)用在對速度要求不是很高喂分,但需要大量緩存存儲的場景锦庸。
內(nèi)存緩存
直接將數(shù)據(jù)存儲到本機內(nèi)存中,通過程序直接維護緩存對象蒲祈,是訪問速度最快的方式甘萧。
6. 緩存架構(gòu)示例
緩存架構(gòu)示例
職責(zé)劃分:
CDN:存放HTML,CSS,JS等靜態(tài)資源;
反向代理:動靜分離梆掸,只緩存用戶請求的靜態(tài)資源扬卷;
分布式緩存:緩存數(shù)據(jù)庫中的熱點數(shù)據(jù);
本地緩存:緩存應(yīng)用字典等常用數(shù)據(jù)沥潭;
請求過程:
瀏覽器向客戶端發(fā)起請求邀泉,如果CDN有緩存則直接返回嬉挡;
如果CDN無緩存钝鸽,則訪問反向代理服務(wù)器;
如果反向代理服務(wù)器有緩存則直接返回庞钢;
如果反向代理服務(wù)器無緩存或動態(tài)請求拔恰,則訪問應(yīng)用服務(wù)器;
應(yīng)用服務(wù)器訪問本地緩存基括;如果有緩存颜懊,則返回代理服務(wù)器,并緩存數(shù)據(jù)风皿;(動態(tài)請求不緩存)
如果本地緩存無數(shù)據(jù)河爹,則讀取分布式緩存;并返回應(yīng)用服務(wù)器桐款;應(yīng)用服務(wù)器將數(shù)據(jù)緩存到本地緩存(部分)咸这;
如果分布式緩存無數(shù)據(jù),則應(yīng)用程序讀取數(shù)據(jù)庫數(shù)據(jù)魔眨,并放入分布式緩存媳维。
參考文獻