1、為什么使用redis
分析:我覺得在項目中使用redis省核,主要是從兩個角度去考慮:性能和并發(fā)墩虹。當(dāng)然,redis還具備可以做分布式鎖等其他功能授嘀,但是如果只是為了分布式鎖這些其他功能物咳,完全還有其他中間件(如zookpeer等)代替,并不是非要使用redis蹄皱。因此览闰,這個問題主要從性能和并發(fā)兩個角度去回答。
回答:如下所示巷折,分為兩點
(一)性能
如下圖所示压鉴,我們在碰到需要執(zhí)行耗時特別久,且結(jié)果不頻繁變動的SQL锻拘,就特別適合將運行結(jié)果放入緩存油吭。這樣,后面的請求就去緩存中讀取逊拍,使得請求能夠迅速響應(yīng)上鞠。
題外話:忽然想聊一下這個迅速響應(yīng)的標準。其實根據(jù)交互效果的不同芯丧,這個響應(yīng)時間沒有固定標準芍阎。不過曾經(jīng)有人這么告訴我:"在理想狀態(tài)下,我們的頁面跳轉(zhuǎn)需要在瞬間解決缨恒,對于頁內(nèi)操作則需要在剎那間解決谴咸。另外轮听,超過一彈指的耗時操作要有進度提示,并且可以隨時中止或取消岭佳,這樣才能給用戶最好的體驗血巍。"
那么瞬間、剎那珊随、一彈指具體是多少時間呢述寡?
根據(jù)《摩訶僧祗律》記載
一剎那者為一念,二十念為一瞬叶洞,二十瞬為一彈指鲫凶,二十彈指為一羅預(yù),二十羅預(yù)為一須臾衩辟,一日一夜有三十須臾螟炫。
那么,經(jīng)過周密的計算艺晴,一瞬間為0.36 秒,一剎那有 0.018 秒.一彈指長達 7.2 秒昼钻。
(二)并發(fā)
如下圖所示,在大并發(fā)的情況下封寞,所有的請求直接訪問數(shù)據(jù)庫然评,數(shù)據(jù)庫會出現(xiàn)連接異常凶异。這個時候冒签,就需要使用redis做一個緩沖操作,讓請求先訪問到redis,而不是直接訪問數(shù)據(jù)庫谦炒。
2、使用redis有什么缺點
分析:大家用redis這么久风喇,這個問題是必須要了解的宁改,基本上使用redis都會碰到一些問題,常見的也就幾個魂莫。
回答:主要是四個問題
(一)緩存和數(shù)據(jù)庫雙寫一致性問題
(二)緩存雪崩問題
(三)緩存擊穿問題
(四)緩存的并發(fā)競爭問題
這四個問題还蹲,我個人是覺得在項目中,比較常遇見的耙考,具體解決方案谜喊,后文給出。
3倦始、單線程的redis為什么這么快
分析:這個問題其實是對redis內(nèi)部機制的一個考察斗遏。其實根據(jù)博主的面試經(jīng)驗,很多人其實都不知道redis是單線程工作模型鞋邑。所以诵次,這個問題還是應(yīng)該要復(fù)習(xí)一下的账蓉。
回答:主要是以下三點
(一)純內(nèi)存操作
(二)單線程操作,避免了頻繁的上下文切換
(三)采用了非阻塞I/O多路復(fù)用機制
題外話:我們現(xiàn)在要仔細的說一說I/O多路復(fù)用機制逾一,因為這個說法實在是太通俗了铸本,通俗到一般人都不懂是什么意思。博主打一個比方:小曲在S城開了一家快遞店遵堵,負責(zé)同城快送服務(wù)箱玷。小曲因為資金限制,雇傭了一批快遞員陌宿,然后小曲發(fā)現(xiàn)資金不夠了汪茧,只夠買一輛車送快遞。
經(jīng)營方式一
客戶每送來一份快遞限番,小曲就讓一個快遞員盯著舱污,然后快遞員開車去送快遞。慢慢的小曲就發(fā)現(xiàn)了這種經(jīng)營方式存在下述問題
幾十個快遞員基本上時間都花在了搶車上了弥虐,大部分快遞員都處在閑置狀態(tài)扩灯,誰搶到了車,誰就能去送快遞
隨著快遞的增多霜瘪,快遞員也越來越多珠插,小曲發(fā)現(xiàn)快遞店里越來越擠,沒辦法雇傭新的快遞員了
快遞員之間的協(xié)調(diào)很花時間
綜合上述缺點颖对,小曲痛定思痛捻撑,提出了下面的經(jīng)營方式
經(jīng)營方式二
小曲只雇傭一個快遞員。然后呢缤底,客戶送來的快遞顾患,小曲按送達地點標注好,然后依次放在一個地方个唧。最后江解,那個快遞員依次的去取快遞,一次拿一個徙歼,然后開著車去送快遞犁河,送好了就回來拿下一個快遞。
對比
上述兩種經(jīng)營方式對比魄梯,是不是明顯覺得第二種桨螺,效率更高,更好呢酿秸。在上述比喻中:
每個快遞員------------------>每個線程
每個快遞-------------------->每個socket(I/O流)
快遞的送達地點-------------->socket的不同狀態(tài)
客戶送快遞請求-------------->來自客戶端的請求
小曲的經(jīng)營方式-------------->服務(wù)端運行的代碼
一輛車---------------------->CPU的核數(shù)
于是我們有如下結(jié)論
1灭翔、經(jīng)營方式一就是傳統(tǒng)的并發(fā)模型,每個I/O流(快遞)都有一個新的線程(快遞員)管理允扇。
2缠局、經(jīng)營方式二就是I/O多路復(fù)用则奥。只有單個線程(一個快遞員),通過跟蹤每個I/O流的狀態(tài)(每個快遞的送達地點)狭园,來管理多個I/O流读处。
下面類比到真實的redis線程模型,如圖所示
參照上圖唱矛,簡單來說罚舱,就是。我們的redis-client在操作的時候绎谦,會產(chǎn)生具有不同事件類型的socket管闷。在服務(wù)端,有一段I/0多路復(fù)用程序窃肠,將其置入隊列之中包个。然后,文件事件分派器冤留,依次去隊列中取碧囊,轉(zhuǎn)發(fā)到不同的事件處理器中。
需要說明的是纤怒,這個I/O多路復(fù)用機制糯而,redis還提供了select、epoll泊窘、evport熄驼、kqueue等多路復(fù)用函數(shù)庫,大家可以自行去了解烘豹。
4瓜贾、redis的數(shù)據(jù)類型,以及每種數(shù)據(jù)類型的使用場景
分析:是不是覺得這個問題很基礎(chǔ)吴叶,其實我也這么覺得阐虚。然而根據(jù)面試經(jīng)驗發(fā)現(xiàn),至少百分八十的人答不上這個問題蚌卤。建議,在項目中用到后奥秆,再類比記憶逊彭,體會更深,不要硬記构订∥甓#基本上,一個合格的程序員悼瘾,五種類型都會用到囊榜。
回答:一共五種
(一)String
這個其實沒啥好說的审胸,最常規(guī)的set/get操作,value可以是String也可以是數(shù)字卸勺。一般做一些復(fù)雜的計數(shù)功能的緩存砂沛。
(二)hash
這里value存放的是結(jié)構(gòu)化的對象,比較方便的就是操作其中的某個字段曙求。博主在做單點登錄的時候碍庵,就是用這種數(shù)據(jù)結(jié)構(gòu)存儲用戶信息,以cookieId作為key悟狱,設(shè)置30分鐘為緩存過期時間静浴,能很好的模擬出類似session的效果。
(三)list
使用List的數(shù)據(jù)結(jié)構(gòu)挤渐,可以做簡單的消息隊列的功能苹享。另外還有一個就是,可以利用lrange命令浴麻,做基于redis的分頁功能富稻,性能極佳,用戶體驗好白胀。
(四)set
因為set堆放的是一堆不重復(fù)值的集合椭赋。所以可以做全局去重的功能。為什么不用JVM自帶的Set進行去重或杠?因為我們的系統(tǒng)一般都是集群部署哪怔,使用JVM自帶的Set,比較麻煩向抢,難道為了一個做一個全局去重认境,再起一個公共服務(wù),太麻煩了挟鸠。
另外叉信,就是利用交集、并集艘希、差集等操作硼身,可以計算共同喜好,全部的喜好覆享,自己獨有的喜好等功能佳遂。
(五)sorted set
sorted set多了一個權(quán)重參數(shù)score,集合中的元素能夠按score進行排列∪龆伲可以做排行榜應(yīng)用丑罪,取TOP N操作。最后一個應(yīng)用就是可以做范圍查找。
5吩屹、redis的過期策略以及內(nèi)存淘汰機制
分析:這個問題其實相當(dāng)重要跪另,到底redis有沒用到家,這個問題就可以看出來煤搜。比如你redis只能存5G數(shù)據(jù)免绿,可是你寫了10G,那會刪5G的數(shù)據(jù)宅楞。怎么刪的针姿,這個問題思考過么?還有厌衙,你的數(shù)據(jù)已經(jīng)設(shè)置了過期時間距淫,但是時間到了,內(nèi)存占用率還是比較高婶希,有思考過原因么?
回答:
redis采用的是定期刪除+惰性刪除策略榕暇。
為什么不用定時刪除策略?
定時刪除,用一個定時器來負責(zé)監(jiān)視key,過期則自動刪除。雖然內(nèi)存及時釋放喻杈,但是十分消耗CPU資源彤枢。在大并發(fā)請求下,CPU要將時間應(yīng)用在處理請求筒饰,而不是刪除key,因此沒有采用這一策略.
定期刪除+惰性刪除是如何工作的呢?
定期刪除缴啡,redis默認每個100ms檢查,是否有過期的key,有過期key則刪除瓷们。需要說明的是业栅,redis不是每個100ms將所有的key檢查一次,而是隨機抽取進行檢查(如果每隔100ms,全部key進行檢查谬晕,redis豈不是卡死)碘裕。因此,如果只采用定期刪除策略攒钳,會導(dǎo)致很多key到時間沒有刪除帮孔。
于是,惰性刪除派上用場不撑。也就是說在你獲取某個key的時候文兢,redis會檢查一下,這個key如果設(shè)置了過期時間那么是否過期了燎孟?如果過期了此時就會刪除禽作。
采用定期刪除+惰性刪除就沒其他問題了么?
不是的,如果定期刪除沒刪除key揩页。然后你也沒即時去請求key,也就是說惰性刪除也沒生效。這樣爆侣,redis的內(nèi)存會越來越高萍程。那么就應(yīng)該采用內(nèi)存淘汰機制。
在redis.conf中有一行配置
# maxmemory-policy volatile-lru
該配置就是配內(nèi)存淘汰策略的(什么兔仰,你沒配過茫负?好好反省一下自己)
1)noeviction:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,新寫入操作會報錯乎赴。應(yīng)該沒人用吧忍法。
2)allkeys-lru:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,在鍵空間中榕吼,移除最近最少使用的key饿序。推薦使用,目前項目在用這種羹蚣。
3)allkeys-random:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時原探,在鍵空間中,隨機移除某個key顽素。應(yīng)該也沒人用吧咽弦,你不刪最少使用Key,去隨機刪。
4)volatile-lru:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時胁出,在設(shè)置了過期時間的鍵空間中型型,移除最近最少使用的key。這種情況一般是把redis既當(dāng)緩存全蝶,又做持久化存儲的時候才用闹蒜。不推薦
5)volatile-random:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,在設(shè)置了過期時間的鍵空間中裸诽,隨機移除某個key嫂用。依然不推薦
6)volatile-ttl:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,在設(shè)置了過期時間的鍵空間中丈冬,有更早過期時間的key優(yōu)先移除嘱函。不推薦
ps:如果沒有設(shè)置 expire 的key, 不滿足先決條件(prerequisites); 那么 volatile-lru, volatile-random 和 volatile-ttl 策略的行為, 和 noeviction(不刪除) 基本上一致。
6埂蕊、redis和數(shù)據(jù)庫雙寫一致性問題
分析:一致性問題是分布式常見問題往弓,還可以再分為最終一致性和強一致性。數(shù)據(jù)庫和緩存雙寫蓄氧,就必然會存在不一致的問題函似。答這個問題,先明白一個前提喉童。就是如果對數(shù)據(jù)有強一致性要求撇寞,不能放緩存。我們所做的一切,只能保證最終一致性蔑担。另外牌废,我們所做的方案其實從根本上來說,只能說降低不一致發(fā)生的概率啤握,無法完全避免鸟缕。因此,有強一致性要求的數(shù)據(jù)排抬,不能放緩存懂从。
回答:《分布式之?dāng)?shù)據(jù)庫和緩存雙寫一致性方案解析》給出了詳細的分析,在這里簡單的說一說蹲蒲。首先番甩,采取正確更新策略,先更新數(shù)據(jù)庫悠鞍,再刪緩存对室。其次,因為可能存在刪除緩存失敗的問題咖祭,提供一個補償措施即可掩宜,例如利用消息隊列。
7么翰、如何應(yīng)對緩存穿透和緩存雪崩問題
分析:這兩個問題牺汤,說句實在話,一般中小型傳統(tǒng)軟件企業(yè)浩嫌,很難碰到這個問題檐迟。如果有大并發(fā)的項目,流量有幾百萬左右码耐。這兩個問題一定要深刻考慮追迟。
回答:如下所示
緩存穿透,即黑客故意去請求緩存中不存在的數(shù)據(jù)骚腥,導(dǎo)致所有的請求都懟到數(shù)據(jù)庫上敦间,從而數(shù)據(jù)庫連接異常。
解決方案:
(一)利用互斥鎖束铭,緩存失效的時候廓块,先去獲得鎖,得到鎖了契沫,再去請求數(shù)據(jù)庫带猴。沒得到鎖,則休眠一段時間重試
(二)采用異步更新策略懈万,無論key是否取到值拴清,都直接返回靶病。value值中維護一個緩存失效時間,緩存如果過期贷掖,異步起一個線程去讀數(shù)據(jù)庫嫡秕,更新緩存渴语。需要做緩存預(yù)熱(項目啟動前苹威,先加載緩存)操作。
(三)提供一個能迅速判斷請求是否有效的攔截機制驾凶,比如牙甫,利用布隆過濾器,內(nèi)部維護一系列合法有效的key调违。迅速判斷出窟哺,請求所攜帶的Key是否合法有效。如果不合法技肩,則直接返回且轨。
緩存雪崩,即緩存同一時間大面積的失效虚婿,這個時候又來了一波請求旋奢,結(jié)果請求都懟到數(shù)據(jù)庫上,從而導(dǎo)致數(shù)據(jù)庫連接異常然痊。
解決方案:
(一)給緩存的失效時間至朗,加上一個隨機值,避免集體失效剧浸。
(二)使用互斥鎖锹引,但是該方案吞吐量明顯下降了。
(三)雙緩存唆香。我們有兩個緩存嫌变,緩存A和緩存B。緩存A的失效時間為20分鐘躬它,緩存B不設(shè)失效時間腾啥。自己做緩存預(yù)熱操作。然后細分以下幾個小點
I 從緩存A讀數(shù)據(jù)庫虑凛,有則直接返回
II A沒有數(shù)據(jù)碑宴,直接從B讀數(shù)據(jù),直接返回桑谍,并且異步啟動一個更新線程延柠。
III 更新線程同時更新緩存A和緩存B。
8锣披、如何解決redis的并發(fā)競爭key問題
分析:這個問題大致就是贞间,同時有多個子系統(tǒng)去set一個key贿条。這個時候要注意什么呢?大家思考過么增热。需要說明一下整以,博主提前百度了一下,發(fā)現(xiàn)答案基本都是推薦用redis事務(wù)機制峻仇。博主不推薦使用redis的事務(wù)機制公黑。因為我們的生產(chǎn)環(huán)境,基本都是redis集群環(huán)境摄咆,做了數(shù)據(jù)分片操作凡蚜。你一個事務(wù)中有涉及到多個key操作的時候,這多個key不一定都存儲在同一個redis-server上吭从。因此朝蜘,redis的事務(wù)機制,十分雞肋涩金。
回答:如下所示
(1)如果對這個key操作谱醇,不要求順序
這種情況下,準備一個分布式鎖步做,大家去搶鎖副渴,搶到鎖就做set操作即可,比較簡單辆床。
(2)如果對這個key操作佳晶,要求順序
假設(shè)有一個key1,系統(tǒng)A需要將key1設(shè)置為valueA,系統(tǒng)B需要將key1設(shè)置為valueB,系統(tǒng)C需要將key1設(shè)置為valueC.
期望按照key1的value值按照 valueA-->valueB-->valueC的順序變化。這種時候我們在數(shù)據(jù)寫入數(shù)據(jù)庫的時候讼载,需要保存一個時間戳轿秧。假設(shè)時間戳如下
系統(tǒng)A key 1 {valueA? 3:00}
系統(tǒng)B key 1 {valueB? 3:05}
系統(tǒng)C key 1 {valueC? 3:10}
那么,假設(shè)這會系統(tǒng)B先搶到鎖咨堤,將key1設(shè)置為{valueB 3:05}菇篡。接下來系統(tǒng)A搶到鎖,發(fā)現(xiàn)自己的valueA的時間戳早于緩存中的時間戳一喘,那就不做set操作了驱还。以此類推。
其他方法凸克,比如利用隊列议蟆,將set方法變成串行訪問也可以∥剑總之咐容,靈活變通。
總結(jié)
本文對redis的常見問題做了一個總結(jié)蚂维。大部分是自己在工作中遇到戳粒,以及以前面試別人的時候路狮,愛問的一些問題。另外蔚约,不推薦大家臨時抱佛腳奄妨,真正碰到一些有經(jīng)驗的工程師,其實幾下就能把你問懵苹祟。最后砸抛,希望大家有所收獲吧。
有對大數(shù)據(jù)感興趣想學(xué)習(xí)大數(shù)據(jù)的朋友可以加微信領(lǐng)取一套免費的大數(shù)據(jù)學(xué)習(xí)視頻 微信號:Lxiao_28.備注大數(shù)據(jù)資料哦苔咪!