Redis
是典型的單線(xiàn)程架構(gòu)领舰,所有的讀寫(xiě)操作都是在一條主線(xiàn)程中完成的四敞。當(dāng)Redis
用于高并發(fā)場(chǎng)景時(shí),這條線(xiàn)程就變的極其重要简识。如果它出現(xiàn)阻塞赶掖,就會(huì)對(duì)應(yīng)用帶來(lái)致命的問(wèn)題。當(dāng) Redis
出現(xiàn)阻塞時(shí)七扰,可以從以下方面著手分析奢赂。
內(nèi)在原因
當(dāng)出現(xiàn)阻塞時(shí),應(yīng)該首先排查是否Redis
自身原因?qū)е戮弊摺F渥陨砜赡軐?dǎo)致阻塞的原因有
API或數(shù)據(jù)結(jié)構(gòu)使用不合理
當(dāng)Redis
中的 API或數(shù)據(jù)結(jié)構(gòu)使用不當(dāng)時(shí)膳灶,就會(huì)出現(xiàn)慢查詢(xún),從而會(huì)導(dǎo)致疫鹊,Redis
處理相對(duì)較慢袖瞻。
1 發(fā)現(xiàn)慢查詢(xún)
通過(guò)命令 slowlog get {n}
可以獲取最近的 n 條慢查詢(xún)命令。當(dāng)發(fā)現(xiàn)慢查詢(xún)后拆吆,可以通過(guò)如下方式進(jìn)行調(diào)整
- 修改為低算法度的命令,如
getall
改為hmget
等脂矫,禁用keys
枣耀,sort
等。 - 調(diào)整大對(duì)象:縮減大對(duì)象數(shù)據(jù)或把大對(duì)象拆分為多個(gè)小對(duì)象,防止一次命令操作過(guò)多數(shù)據(jù)
2 發(fā)現(xiàn)大對(duì)象
通過(guò)命令 redis-cli -h {ip} -p {port} --bigkeys
查找大對(duì)象捞奕。
CPU飽和
單線(xiàn)程的Redis
處理命令時(shí)只能使用一個(gè)CPU牺堰,CPU飽和是指Redis
把單核 CPU 使用率達(dá)到接近 100% ÷В可以使用 top
命令找出 對(duì)應(yīng)的 Redis
進(jìn)程伟葫。然后,通過(guò) 使用 redis-cli -h {ip} -p {port} --stat
獲取當(dāng)前 Redis
的使用情況院促。也可以通過(guò) info commandstats
統(tǒng)計(jì)信息分析出命令不合理開(kāi)心時(shí)間筏养。
持久化相關(guān)的阻塞
引起主線(xiàn)程阻塞的持久化操作有
1 fork 阻塞
Redis
在 RDB
和 AOF
重寫(xiě)是,會(huì)通過(guò) fork
操作創(chuàng)建共享內(nèi)存的子進(jìn)程常拓,如果 fork
操作本身比較耗時(shí)渐溶,就會(huì)導(dǎo)致 主線(xiàn)程阻塞。
可以通過(guò) 命令 info stats
獲取 latest_fork_usec
指標(biāo)弄抬,其表示 Redis
最近一次 fork
操作耗時(shí)茎辐。
2 AOF 刷盤(pán)阻塞
當(dāng)開(kāi)啟 AOF
持久化功能時(shí),一般是采用一秒刷盤(pán)一次的方式掂恕,當(dāng)硬盤(pán)壓力過(guò)大時(shí)拖陆,刷盤(pán)操作就會(huì)等待,直到寫(xiě)完懊亡∫绬可以通過(guò)命令info persistence
統(tǒng)計(jì)中的aof_delayed_fsync
指標(biāo)分析。
3 HugePage 寫(xiě)操作阻塞
由于子進(jìn)程在重新期間是采用的 寫(xiě)時(shí)復(fù)制
來(lái)降低內(nèi)存開(kāi)銷(xiāo)斋配,如果對(duì)開(kāi)啟了 Transparent HugePages 的操作系統(tǒng)孔飒,每次寫(xiě)命令引起的復(fù)制內(nèi)存頁(yè)將會(huì)很大,會(huì)拖慢寫(xiě)操作的執(zhí)行時(shí)間艰争,導(dǎo)致大量的寫(xiě)操作慢查詢(xún)坏瞄。
外在原因
如果排查 Redis
內(nèi)因引起的阻塞原因后,還是沒(méi)有定位到問(wèn)題甩卓,就需要排查一下外因了鸠匀。
CPU競(jìng)爭(zhēng)
-
進(jìn)程競(jìng)爭(zhēng):
Redis
是CPU
密集型應(yīng)用,最好不要跟其他CPU
密集型服務(wù)部署在一起逾柿。 -
綁定CPU:有時(shí)為了減少CPU頻繁上下文切換缀棍,把
Redis
綁定到 CPU 上。此種情況當(dāng) 進(jìn)行 RDB 或 AOF 重寫(xiě)時(shí)机错,就會(huì)導(dǎo)致 CPU 使用率飆高爬范。
內(nèi)存交換
內(nèi)存交換對(duì)于Redis
來(lái)說(shuō)是非常致命的,Redis
保證高性能的一個(gè)重要前提是所有的數(shù)據(jù)在內(nèi)存中弱匪。如果操作系統(tǒng)把 Redis
使用的內(nèi)存數(shù)據(jù)置換到硬盤(pán)中翩瓜,由于內(nèi)存和硬盤(pán)的讀寫(xiě)速度相差幾個(gè)數(shù)據(jù)量級(jí)聪廉,從而會(huì)導(dǎo)致Redis
的性能急劇下降终息。 可以通過(guò)如下方式檢查是否存在內(nèi)存交換:
- 查詢(xún) Redis 進(jìn)程號(hào)
redis-cli -p {port} info server | grep process_id
- 根據(jù)進(jìn)程號(hào)查詢(xún)內(nèi)存交換信息
cat /proc/{process_id}/smaps | grep Swap
防止內(nèi)存交換方法
- 保證機(jī)器可用內(nèi)存充足
- 確保所有 Redis 實(shí)例設(shè)置最大可用內(nèi)存
- 降低系統(tǒng)內(nèi)存使用 swap 優(yōu)先級(jí)。
網(wǎng)絡(luò)問(wèn)題
網(wǎng)絡(luò)問(wèn)題經(jīng)常是引起 Redis
阻塞的問(wèn)題點(diǎn)枝嘶。常見(jiàn)的網(wǎng)絡(luò)問(wèn)主要有:
連接拒絕
- 網(wǎng)絡(luò)閃斷:一般發(fā)生在網(wǎng)絡(luò)割接或帶寬耗盡的情況,這種情況比較難識(shí)別
- Redis 連接拒絕:連接數(shù) 超過(guò)了 maxclients 參數(shù)控制的最大允許連接數(shù)
- 連接溢出:超過(guò)Linux 操作系統(tǒng)現(xiàn)在最大文件數(shù)控制 或者 tcp-backlog 超過(guò)最大數(shù)哑诊。
網(wǎng)絡(luò)延遲
此種方式主要是 客戶(hù)端到 Redis
服務(wù)器之間的網(wǎng)絡(luò)環(huán)境問(wèn)題群扶。
網(wǎng)卡軟中斷
網(wǎng)卡中斷是指由于單個(gè)網(wǎng)卡隊(duì)列只能使用一個(gè) CPU,高并發(fā)下網(wǎng)卡數(shù)據(jù)交換都集中在同一個(gè) CPU镀裤,導(dǎo)致無(wú)法充分利用多核 CPU的情況竞阐。網(wǎng)卡軟中斷瓶頸一般出現(xiàn)在網(wǎng)絡(luò)高流量吞吐的場(chǎng)景。