緩存與數(shù)據(jù)庫一致性之三：緩存穿透、緩存雪崩晒奕、key重建方案

一闻书、緩存穿透預防及優(yōu)化?

緩存穿透是指查詢一個根本不存在的數(shù)據(jù)，緩存層和存儲層都不會命中脑慧，但是出于容錯的考慮惠窄，如果從存儲層查不到數(shù)據(jù)則不寫入緩存層，如圖 11-3 所示整個過程分為如下 3 步：

緩存層不命中

存儲層不命中漾橙，所以不將空結果寫回緩存

返回空結果?

　　　　緩存穿透將導致不存在的數(shù)據(jù)每次請求都要到存儲層去查詢，失去了緩存保護后端存儲的意義楞卡。

圖-1：緩存穿透模型

緩存穿透問題可能會使后端存儲負載加大霜运，由于很多后端存儲不具備高并發(fā)性脾歇，甚至可能造成后端存儲宕掉。通程约瘢可以在程序中分別統(tǒng)計總調用數(shù)藕各、緩存層命中數(shù)、存儲層命中數(shù)焦除，如果發(fā)現(xiàn)大量存儲層空命中激况，可能就是出現(xiàn)了緩存穿透問題。

造成緩存穿透的基本有兩個膘魄。第一乌逐，業(yè)務自身代碼或者數(shù)據(jù)出現(xiàn)問題，第二创葡，一些惡意攻擊浙踢、爬蟲等造成大量空命中，下面我們來看一下如何解決緩存穿透問題灿渴。

二洛波、緩存穿透的解決方法

1）緩存空對象

如下圖所示，當?shù)?2 步存儲層不命中后骚露，仍然將空對象保留到緩存層中蹬挤，之后再訪問這個數(shù)據(jù)將會從緩存中獲取，保護了后端數(shù)據(jù)源棘幸。

緩存空對象會有兩個問題：

第一焰扳，空值做了緩存，意味著緩存層中存了更多的鍵够话，需要更多的內存空間 ( 如果是攻擊蓝翰，問題更嚴重 )，比較有效的方法是針對這類數(shù)據(jù)設置一個較短的過期時間女嘲，讓其自動剔除畜份。

第二，緩存層和存儲層的數(shù)據(jù)會有一段時間窗口的不一致欣尼，可能會對業(yè)務有一定影響爆雹。例如過期時間設置為 5 分鐘，如果此時存儲層添加了這個數(shù)據(jù)愕鼓，那此段時間就會出現(xiàn)緩存層和存儲層數(shù)據(jù)的不一致钙态，此時可以利用消息系統(tǒng)或者其他方式清除掉緩存層中的空對象。

下面給出了緩存空對象的實現(xiàn)偽代碼：

2）布隆過濾器攔截

如下圖所示菇晃，在訪問緩存層和存儲層之前册倒，將存在的 key 用布隆過濾器提前保存起來，做第一層攔截磺送。

例如：一個個性化推薦系統(tǒng)有 4 億個用戶 ID驻子，每個小時算法工程師會根據(jù)每個用戶之前歷史行為做出來的個性化放到存儲層中灿意，但是最新的用戶由于沒有歷史行為，就會發(fā)生緩存穿透的行為崇呵，為此可以將所有有個性化推薦數(shù)據(jù)的用戶做成布隆過濾器缤剧。如果布隆過濾器認為該用戶 ID 不存在，那么就不會訪問存儲層域慷，在一定程度保護了存儲層荒辕。

開發(fā)提示：

有關布隆過濾器的相關知識，可以參考：Bloom Filter(布隆過濾器)的概念和原理

可以利用 Redis 的 Bitmaps 實現(xiàn)布隆過濾器犹褒，GitHub 上已經(jīng)開源了類似的方案抵窒，讀者可以進行參考：

https://github.com/erikdubbelboer/Redis-Lua-scaling-bloom-filter

使用布隆過濾器應對穿透問題

這種方法適用于數(shù)據(jù)命中不高，數(shù)據(jù)相對固定實時性低（通常是數(shù)據(jù)集較大）的應用場景化漆，代碼維護較為復雜估脆，但是緩存空間占用少。

兩種方案對比

前面介紹了緩存穿透問題的兩種解決方法 ( 實際上這個問題是一個開放問題座云，有很多解決方法 )疙赠，下面通過下表從適用場景和維護成本兩個方面對兩種方案進行分析。

緩存空對象和布隆過濾器方案對比

三朦拖、緩存雪崩問題優(yōu)化?

從下圖可以很清晰出什么是緩存雪崩：由于緩存層承載著大量請求圃阳，有效的保護了存儲層，但是如果緩存層由于某些原因整體不能提供服務璧帝，于是所有的請求都會達到存儲層捍岳，存儲層的調用量會暴增，造成存儲層也會掛掉的情況睬隶。緩存雪崩的英文原意是 stampeding herd（奔逃的野牛）锣夹，指的是緩存層宕掉后，流量會像奔逃的野牛一樣苏潜，打向后端存儲银萍。

緩存層不可用引起的雪崩

預防和解決緩存雪崩問題，可以從以下三個方面進行著手恤左。

1）保證緩存層服務高可用性贴唇。

和飛機都有多個引擎一樣，如果緩存層設計成高可用的飞袋，即使個別節(jié)點戳气、個別機器、甚至是機房宕掉巧鸭，依然可以提供服務瓶您，例如前面介紹過的 Redis Sentinel 和 Redis Cluster 都實現(xiàn)了高可用。

2）依賴隔離組件為后端限流并降級。

無論是緩存層還是存儲層都會有出錯的概率览闰，可以將它們視同為資源芯肤。作為并發(fā)量較大的系統(tǒng)，假如有一個資源不可用压鉴，可能會造成線程全部 hang 在這個資源上，造成整個系統(tǒng)不可用锻拘。降級在高并發(fā)系統(tǒng)中是非常正常的：比如推薦服務中油吭，如果個性化推薦服務不可用，可以降級補充熱點數(shù)據(jù)署拟，不至于造成前端頁面是開天窗婉宰。

在實際項目中，我們需要對重要的資源 ( 例如 Redis推穷、 MySQL心包、 Hbase、外部接口 ) 都進行隔離馒铃，讓每種資源都單獨運行在自己的線程池中蟹腾，即使個別資源出現(xiàn)了問題，對其他服務沒有影響区宇。但是線程池如何管理娃殖，比如如何關閉資源池，開啟資源池议谷，資源池閥值管理炉爆，這些做起來還是相當復雜的，這里推薦一個 Java 依賴隔離工具 Hystrix(https://github.com/Netflix/Hystrix)卧晓，如下圖所示芬首。

Hystrix 是解決依賴隔離的利器，但是該內容已經(jīng)超出本書的范圍逼裆，同時只適用于 Java 應用郁稍，所以這里不會詳細介紹。

Hystrix 示意圖

3）提前演練波附。在項目上線前艺晴，演練緩存層宕掉后，應用以及后端的負載情況以及可能出現(xiàn)的問題掸屡，在此基礎上做一些預案設定封寞。

四、緩存熱點 key 重建優(yōu)化?

開發(fā)人員使用緩存 + 過期時間的策略既可以加速數(shù)據(jù)讀寫仅财，又保證數(shù)據(jù)的定期更新狈究，這種模式基本能夠滿足絕大部分需求。但是有兩個問題如果同時出現(xiàn)盏求，可能就會對應用造成致命的危害：

當前 key 是一個熱點 key( 例如一個熱門的娛樂新聞）抖锥，并發(fā)量非常大亿眠。

重建緩存不能在短時間完成，可能是一個復雜計算磅废，例如復雜的 SQL纳像、多次 IO、多個依賴等拯勉。

在緩存失效的瞬間竟趾，有大量線程來重建緩存 ( 如下圖)，造成后端負載加大宫峦，甚至可能會讓應用崩潰岔帽。

熱點 key 失效后大量線程重建緩存

要解決這個問題也不是很復雜，但是不能為了解決這個問題給系統(tǒng)帶來更多的麻煩导绷，所以需要制定如下目標：

減少重建緩存的次數(shù)

數(shù)據(jù)盡可能一致

較少的潛在危險

1.?加鎖排隊. 限流-- 限流算法. 1.計數(shù) 2.滑動窗口 3.? 令牌桶Token Bucket?4.漏桶 leaky bucket [1]

?在緩存失效后犀勒，通過加鎖或者隊列來控制讀數(shù)據(jù)庫寫緩存的線程數(shù)量。比如對某個key只允許一個線程查詢數(shù)據(jù)和寫緩存妥曲，其他線程等待贾费。

?業(yè)界比較常用的做法，是使用mutex逾一。簡單地來說铸本，就是在緩存失效的時候（判斷拿出來的值為空），不是立即去load db遵堵，而是先使用緩存工具的某些帶成功操作返回值的操作（比如Redis的SETNX或者Memcache的ADD）去set一個mutex key箱玷，當操作返回成功時，再進行l(wèi)oad db的操作并回設緩存陌宿；否則锡足，就重試整個get緩存的方法。

SETNX壳坪，是「SET if Not eXists」的縮寫舶得，也就是只有不存在的時候才設置，可以利用它來實現(xiàn)鎖的效果爽蝴。

(1）互斥鎖 (mutex key)

此方法只允許一個線程重建緩存沐批，其他線程等待重建緩存的線程執(zhí)行完，重新從緩存獲取數(shù)據(jù)即可蝎亚，整個過程如圖 :

使用互斥鎖重建緩存

下面代碼使用 Redis 的 setnx 命令實現(xiàn)上述功能九孩。

(1) 從 Redis 獲取數(shù)據(jù)，如果值不為空发框，則直接返回值躺彬，否則執(zhí)行 (2.1) 和 (2.2)。

(2) 如果 set(nx 和 ex) 結果為 true，說明此時沒有其他線程重建緩存宪拥，那么當前線程執(zhí)行緩存構建邏輯仿野。

(2.2) 如果 setnx(nx 和 ex) 結果為 false，說明此時已經(jīng)有其他線程正在執(zhí)行構建緩存的工作她君，那么當前線程將休息指定時間 ( 例如這里是 50 毫秒脚作，取決于構建緩存的速度 ) 后，重新執(zhí)行函數(shù)缔刹，直到獲取到數(shù)據(jù)鳖枕。

2.數(shù)據(jù)預熱

? 可以通過緩存reload機制，預先去更新緩存桨螺，再即將發(fā)生大并發(fā)訪問前手動觸發(fā)加載緩存不同的key，設置不同的過期時間酿秸，讓緩存失效的時間點盡量均勻

?3.做二級緩存灭翔，或者雙緩存策略。

A1為原始緩存辣苏，A2為拷貝緩存肝箱，A1失效時，可以訪問A2稀蟋，A1緩存失效時間設置為短期煌张，A2設置為長期。

4.永遠不過期

“永遠不過期”包含兩層意思：

(1)?從緩存上看退客，確實沒有設置過期時間骏融，這就保證了，不會出現(xiàn)熱點key過期問題萌狂，也就是“物理”不過期档玻。

(2)?從功能上看，如果不過期茫藏，那不就成靜態(tài)的了嗎误趴？所以我們把過期時間存在key對應的value里，如果發(fā)現(xiàn)要過期了务傲，通過一個后臺的異步線程進行緩存的構建凉当，也就是“邏輯”過期.

?從實戰(zhàn)看，這種方法對于性能非常友好售葡，唯一不足的就是構建緩存時候看杭，其余線程(非構建緩存的線程)可能訪問的是老數(shù)據(jù)，但是對于一般的互聯(lián)網(wǎng)功能來說這個還是可以忍受天通。

整個過程如下圖所示：

” 永遠不過期 ” 策略

從實戰(zhàn)看泊窘，此方法有效杜絕了熱點 key 產(chǎn)生的問題，但唯一不足的就是重構緩存期間，會出現(xiàn)數(shù)據(jù)不一致的情況烘豹，這取決于應用方是否容忍這種不一致瓜贾。下面代碼使用 Redis 進行模擬：

作為一個并發(fā)量較大的應用，在使用緩存時有三個目標：第一携悯，加快用戶訪問速度祭芦，提高用戶體驗。第二憔鬼，降低后端負載龟劲，減少潛在的風險，保證系統(tǒng)平穩(wěn)轴或。第三昌跌，保證數(shù)據(jù)“盡可能”及時更新。下面將按照這三個維度對上述兩種解決方案進行分析照雁。

互斥鎖 (mutex key)：這種方案思路比較簡單蚕愤，但是存在一定的隱患，如果構建緩存過程出現(xiàn)問題或者時間較長饺蚊，可能會存在死鎖和線程池阻塞的風險萍诱，但是這種方法能夠較好的降低后端存儲負載并在一致性上做的比較好。

” 永遠不過期 “：這種方案由于沒有設置真正的過期時間污呼，實際上已經(jīng)不存在熱點 key 產(chǎn)生的一系列危害裕坊，但是會存在數(shù)據(jù)不一致的情況，同時代碼復雜度會增大燕酷。

兩種解決方法對比如下表所示籍凝。

兩種熱點 key 的解決方法

最后編輯于：2018.09.06 17:21:23

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市悟狱，隨后出現(xiàn)的幾起案子静浴，更是在濱河造成了極大的恐慌，老刑警劉巖挤渐，帶你破解...
沈念sama閱讀 218,858評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件苹享，死亡現(xiàn)場離奇詭異，居然都是意外死亡浴麻，警方通過查閱死者的電腦和手機得问，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,372評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來软免，“玉大人宫纬，你說我怎么就攤上這事「嘞簦” “怎么了漓骚？”我有些...
開封第一講書人閱讀 165,282評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵蝌衔，是天一觀的道長。經(jīng)常有香客問我蝌蹂，道長噩斟，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,842評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任孤个，我火速辦了婚禮剃允，結果婚禮上，老公的妹妹穿的比我還像新娘齐鲤。我一直安慰自己斥废，他們只是感情好，可當我...
茶點故事閱讀 67,857評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布给郊。她就那樣靜靜地躺著牡肉，像睡著了一般。火紅的嫁衣襯著肌膚如雪淆九。梳的紋絲不亂的頭發(fā)上荚板，一...
開封第一講書人閱讀 51,679評論 1贊 305
城市分裂傳說
那天，我揣著相機與錄音吩屹，去河邊找鬼。笑死拧抖，一個胖子當著我的面吹牛煤搜，可吹牛的內容都是我干的。我是一名探鬼主播唧席，決...
沈念sama閱讀 40,406評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼擦盾，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了淌哟？” 一聲冷哼從身側響起迹卢，我...
開封第一講書人閱讀 39,311評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎徒仓，沒想到半個月后腐碱，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,767評論 1贊 315
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡掉弛，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,945評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年症见，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片殃饿。...
茶點故事閱讀 40,090評論 1贊 350
活死人
序言：一個原本活蹦亂跳的男人離奇死亡谋作，死狀恐怖，靈堂內的尸體忽然破棺而出乎芳，到底是詐尸還是另有隱情遵蚜，我是刑警寧澤帖池，帶...
沈念sama閱讀 35,785評論 5贊 346
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站吭净，受9級特大地震影響睡汹，放射性物質發(fā)生泄漏。R本人自食惡果不足惜攒钳，卻給世界環(huán)境...
茶點故事閱讀 41,420評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一帮孔、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧不撑，春花似錦文兢、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,988評論 0贊 22
一樁弒父案姆坚，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至实愚，卻和暖如春兼呵，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背腊敲。一陣腳步聲響...
開封第一講書人閱讀 33,101評論 1贊 271
情欲美人皮
我被黑心中介騙來泰國打工击喂，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人碰辅。一個月前我還...
沈念sama閱讀 48,298評論 3贊 372
代替公主和親
正文我出身青樓懂昂，卻偏偏與公主長得像，于是被迫代替她去往敵國和親没宾。傳聞我的和親對象是個殘疾皇子凌彬，可洞房花燭夜當晚...
茶點故事閱讀 45,033評論 2贊 355

緩存與數(shù)據(jù)庫一致性之三：緩存穿透肠缨、緩存雪崩逆趋、key重建方案

緩存與數(shù)據(jù)庫一致性之三：緩存穿透、緩存雪崩晒奕、key重建方案

推薦閱讀更多精彩內容