Redis提供了客戶端相關的API對其狀態(tài)進行管理容贝,我們可以利用這些api來更好的運維比如:
- 客戶端連接數(shù)超過限制
- 客戶端連接數(shù)緩沖區(qū)異常(可能客戶端發(fā)了一個異常的請求自脯,超過閾值)
- 客戶端長時間不活動(超過idle時間,可主動斷開)
- 一直阻塞(可以監(jiān)控正在執(zhí)行那個連接的什么命令)
本文參考《Redis開發(fā)與運維》
客戶端通信協(xié)議
Redis使用RESP(Redis Serialization Protocol)實現(xiàn)客戶端與服務端的交互斤富,這種協(xié)議簡單高效膏潮。比如命令 set hello world:
*3
$3
SET
$5
hello
$5
world
命令格式
<參數(shù)數(shù)量>CRLF $<參數(shù)1的字節(jié)數(shù)量> CRLF <參數(shù)1>CRLF
比如上的的命令,一共3個參數(shù)满力,分別是set焕参、hello、world油额,其長度分別為3叠纷、5、5-
返回格式
- 狀態(tài)回復:在RESP中的第一個字節(jié)為“+”
- 錯誤回復:第一個字節(jié)為“-”
- 整數(shù)回復:第一個字節(jié)為“:”
- 字符串回復:第一個字節(jié)為“$”
- 多條字符串回復:第一個字節(jié)為“*”
可以使用telnet命令測試潦嘶,或者實現(xiàn)一個socket來模擬
java客戶端
客戶端操作比較簡單重點關注兩點:
- 每次執(zhí)行完不需要連接的時候需要關閉連接
- Jedis的連接池使用方法
客戶端API
client list
獲取所有客戶端列表,返回結果為多行數(shù)據(jù)讲岁,每一行代表客戶端的連接信息
標識: id(客戶端唯一標識)、addr(ip和端口)衬以、fd(socket的文件描述符缓艳,如果是1代表是內(nèi)部的偽客戶端)、name(名稱看峻,可以設置)
-
輸入緩沖區(qū):qbuf阶淘、qbuf-free ,這個的作用是將客戶端發(fā)送的命令臨時保存互妓,同時Redis會從輸入緩沖區(qū)拉取命令并執(zhí)行溪窒。沒有規(guī)定大小,但有最大值1G冯勉,如果超過澈蚌,則會斷開連接,而且如果所有連接的緩沖區(qū)總和超過了總的內(nèi)存限制灼狰,則會產(chǎn)生數(shù)據(jù)丟失宛瞄、OOM的情況。
主要原因是交胚,redis處理速度跟不上命令的速度份汗,比如包含了大量的bigkey,如何解決呢蝴簇?
- 通過定期執(zhí)行client list命令杯活,收集qbuf和qbuf-free找到異常的連接記錄并分析,找到有問題的客戶端(速度比較慢,可能阻塞)熬词。
- 通過info clients 命令找到最大的輸入緩沖區(qū)(無法精準定位到具體客戶端)旁钧。
-
輸出緩沖區(qū):obl吸重、oll、omem歪今,同輸入緩沖區(qū)一樣晤锹,它的作用是保存執(zhí)行的結果。但不同的是彤委,可以設置client-output-buffer-limit鞭铆,提供了更多的選項,內(nèi)部使用動態(tài)緩沖區(qū)和固定緩沖區(qū)結合實現(xiàn)焦影,obl代表固定緩沖區(qū)的長度(對象的個數(shù)车遂,而不是字節(jié)大小),oll代表動態(tài)緩沖區(qū)列表的長度斯辰,omem代表使用的字節(jié)數(shù)舶担。
$ config get client-output-buffer-limit 1) "client-output-buffer-limit" 2) "normal 0 0 0 slave 268435456 67108864 60 pubsub 33554432 8388608 60" # <class> <hard limit> <soft limit> <soft seconds> # normal 0 0 0 # slave 24M 64M 60 # pubsub 32M 8M 60
上面代表了三組,分別是普通客戶端彬呻、slave客戶端衣陶、pubsub發(fā)布訂閱客戶端, hard limit 表示緩沖區(qū)超過了該值,立即關閉闸氮,soft表示剪况,超過了該值多長時間才關閉。
處理方法與輸入緩沖區(qū)類似蒲跨,需要限制普通客戶端的緩沖區(qū)译断,比如高并發(fā)下的monitor命令,但另外需要適當增大slave的輸出緩沖區(qū)或悲,如果master節(jié)點寫入過大孙咪, slave如果緩沖區(qū)溢出,會導致復制重連巡语。
客戶端的存活狀態(tài):age翎蹈、idle分表表示客戶端已連接的時間和空閑時間(距離上一次操作)
客戶端的限制:maxclients 和 timeout,一旦超過最大連接數(shù)男公,新的連接將被拒絕(注意連接泄露)可以使用
config get[set] :maxclients
查看或設置荤堪,使用info clients
查看當前連接數(shù)。timeout用來限制連接的最大空閑時間理澎,也就是上面的idle最大值逞力,如果超過則會斷開曙寡,0表示不限制糠爬。-
客戶端類型:flag=S、N举庶、O分別代表slave执隧、普通客戶端、monitor命令。其他可能的狀態(tài):
flag 表示的類型 N 普通客戶端 M master節(jié)點 S slave節(jié)點 O 當前客戶端正在執(zhí)行monitor命令 b 當前客戶端正在等待阻塞 GETNAME 獲取當前連接的名字 ID 獲取當前連接的ID镀琉,每個客戶端都有唯一的ID
主動關閉客戶端:
client kill <ip>:<port>
暫吐袜停客戶端:
client pause <timeout>
暫停(阻塞)客戶端一定時間,注意這個時候所有普通和發(fā)布訂閱客戶端都將被阻塞屋摔,這是一個很危險的操作烁设。monitor 監(jiān)控redis狀態(tài),能夠監(jiān)控所有客戶端的命令钓试,一旦redis并發(fā)過大装黑,那么該監(jiān)控客戶端的輸出緩沖區(qū)將會非常大。
info stats:除了info clients命令和client list弓熏,
info stats
也有關于客戶端的狀態(tài)信息
客戶端常見異常
在使用客戶端的時候恋谭,無論是客戶端還是服務端,使用不當就會產(chǎn)生一些問題
-
無法獲取到連接
- 客戶端側連接池配置過小挽鞠,導致無法拿到連接
- 客戶端沒有正確使用連接池疚颊,比如沒有釋放
- 客戶端執(zhí)行了慢查詢,導致無法釋放資源
- 服務端正在執(zhí)行阻塞信认,導致命令或連接超時
-
讀寫超時或客戶端連接超時 :
- 讀寫時間設置過短
- 命令不合理材义,導致執(zhí)行時間超過閾值
- 網(wǎng)絡不正常
- redis自身阻塞
-
客戶端緩沖區(qū)異常:
- 輸出緩沖區(qū)滿,比如用get命令獲取一個超大的數(shù)據(jù)嫁赏,但配置的閾值較小
- 長時間空閑連接母截,被斷開
- 不正常的并發(fā)操作連接
案例
-
Redis內(nèi)存突增,主節(jié)點內(nèi)存達到maxmemory
- 現(xiàn)象:客戶端無法則正常調(diào)用
- 原因:1.大量數(shù)據(jù)寫入橄教,主從復制出現(xiàn)問題清寇,2. 緩沖區(qū)不正常,可以排查(monitor命令等)
-
客戶端周期性的超時
- 通過觀察慢查詢?nèi)罩居涗浕さl(fā)現(xiàn)只要有慢查詢就會有大量連接超時华烟。應盡量減少慢查詢