0 Redis 介紹
0.1 基礎(chǔ)知識(shí)
不僅僅是簡(jiǎn)單的key-value數(shù)據(jù)庫(kù)猪叙,更是一個(gè)in-memory data structure store沐悦。不僅僅支持簡(jiǎn)單的String key對(duì)應(yīng)String value五督,還支持眾多的類型數(shù)據(jù):Binary-safe Strings充包、Lists、Sets淆储、Sorted Sets本砰、Hashes钢悲、Bit arrays莺琳、HyperLogLogs惭等、Streams
key是binary safe ,可以使任意二進(jìn)制串琳要,甚至是JPEG文件的內(nèi)容焙蹭。key和value 都不能超過(guò)512MB孔厉。
最基本的操作SET 和 GET 撰豺、INCR 增加value值拼余。EXISTS 訪問(wèn)key space確認(rèn)是否存在key,DEL刪除key和value凡橱。
0.2 Redis expires
Redis expires特性:Redis expires: keys with limited time to live亭姥。設(shè)置粒度最小為1ms达罗,過(guò)期時(shí)間會(huì)保存在硬盤上。EXPIRE命令抚笔,TTL檢查殊橙,PERSIST命令可以讓key不過(guò)期狱从。
0.3 Redis lists
基于Linked Lists實(shí)現(xiàn)的矫夯。 Linked List的特點(diǎn):這樣在List頭部或者尾部增加1個(gè)element的時(shí)間是常數(shù)時(shí)間,無(wú)論List里面有幾個(gè)element還是有上百萬(wàn)個(gè)element制肮。當(dāng)然也有缺點(diǎn):檢索很慢递沪。
Redis lists 使用Linked Lists款慨,考慮的是作為數(shù)據(jù)庫(kù)系統(tǒng),快速地插入數(shù)據(jù)到一個(gè)長(zhǎng)的list是非常重要的桩了。Redis實(shí)現(xiàn)在常數(shù)時(shí)間獲取lists埠戳。
如果想要快速訪問(wèn)集合中間位置的數(shù)據(jù)整胃,可以使用sorted sets。
使用LPUSH 表頭插入在岂,RPUSH尾部插入蛮寂,LRANGE KEY Start_index End_index 訪問(wèn)list指定區(qū)間數(shù)據(jù)共郭。index 0開始,-1是倒數(shù)第一個(gè)写半。LPUSH 是 可變長(zhǎng)的命令尉咕,可以一口氣輸入多個(gè)值年缎。
可以POP操作,獲取并且從list刪掉一個(gè)元素蜕该。LPOP 或者 RPOP洲鸠,如果lists沒(méi)有內(nèi)容了扒腕,就會(huì)返回null
0.3.1 Redis lists 場(chǎng)景
- 社交網(wǎng)絡(luò),記錄用戶最近的文章(比如 twitter 使用 Redis lists 來(lái)記錄用戶最新的tweets)
- 進(jìn)程間通信皆的,用來(lái)做消息隊(duì)列费薄,Producer和Consumer栖雾。(ruby 使用進(jìn)行 background jobs)
常見例子:
1.每當(dāng)有用戶產(chǎn)生新的消息,就把消息ID LPUSH 到 lists中拌倍;
2.當(dāng)有其他用戶訪問(wèn)網(wǎng)站的時(shí)候柱恤,就LRANGE 0 9 選擇最新的10個(gè)消息展示找爱;
0.3.2 Capped Lists 蓋帽lists
通過(guò)LTRIM 0 99 可以只保持车摄,最新的100個(gè)記錄仑鸥,其他的會(huì)被刪除眼俊。
0.3.3 Blocking operations Lists鎖操作
LPOP和RPOP升級(jí)版粟关,可以進(jìn)行等待再返回,BLPOP和BRPOP KEY 等待時(shí)間(B 應(yīng)該是 Block)闷板。等待時(shí)間內(nèi)有新的element遮晚,返回,否則返回null巩梢。 但是返回值是key-value對(duì)艺玲,因?yàn)榭赡軙?huì)等待多個(gè)lists(支持等待多個(gè)lists)饭聚,而且如果多個(gè)client同時(shí)消費(fèi)一個(gè)lists,先到先服務(wù)法绵。
還有其他command : RPOPLPUSH 和 BRPOPLPUSH
0.3.4 自動(dòng)創(chuàng)建和刪除list key
不光是 list 更適用于data types composed of multiple elements -- Streams, Sets, Sorted Sets and Hashes.
對(duì)應(yīng)三條規(guī)則:
1.當(dāng)向 aggregate data type增加element朋譬,如果key不存在徙赢,就先創(chuàng)建他探越,再插入element钦幔。
2.當(dāng)從aggregate data type刪除element,如果空了的話搀擂,就會(huì)刪除對(duì)應(yīng)的key,stream類型除外喷市。
3.對(duì)應(yīng)空的key的話咆蒿,使用只讀 command 例如 LLEN沃测,或者remove 命令食茎,仿佛存在這個(gè)沒(méi)有element的key一樣别渔。
0.4 Redis Hashes
一個(gè)key 對(duì)應(yīng)多個(gè)鍵值對(duì),類似Table或者M(jìn)ap喇伯、Dict稻据。
HMSET 可以sets multiple fields of the hash
HMGET 返回一個(gè)array關(guān)于multiple fields對(duì)應(yīng)value
HGET 返回單個(gè)值
HINCRBY 增加單個(gè)值
小的hashs (element少,values新蛐)在內(nèi)存中以特殊編碼方式存儲(chǔ)捻悯,效率很高。
0.5 Redis Sets
Redis Sets 是無(wú)序String的集合淤毛。
SADD key elements 向sets添加一個(gè)element今缚,還可以進(jìn)行其他sets數(shù)據(jù)結(jié)構(gòu)式的操作。
smembers key 查看sets所有的元素低淡。
sismember key element 檢查元素是否是在sets姓言,1是,0否蔗蹋。
應(yīng)用場(chǎng)景1:標(biāo)簽系統(tǒng)
可以正向給客戶或者文章打標(biāo)簽事期,每一個(gè)客戶或者文章就對(duì)應(yīng)這一個(gè)key纸颜,他們的標(biāo)簽就都放到key對(duì)應(yīng)的set里面兽泣。
反向可以每個(gè)標(biāo)簽作為key,他們對(duì)應(yīng)的文章或者客戶放到對(duì)應(yīng)的set里面胁孙。
使用:可以通過(guò)SINTER 實(shí)現(xiàn)取多個(gè)set內(nèi)容的交集唠倦。當(dāng)然也可以u(píng)nions, difference, extract a random element
應(yīng)用場(chǎng)景2:在線撲克游戲
可以設(shè)置一個(gè)set存儲(chǔ)52張牌称鳞,SPOP每次取出一張牌。
為了防止一副牌set被POP沒(méi)有元素稠鼻,可以在每一局開始的時(shí)候進(jìn)行copy牌集操作冈止。使用SUNIONSTORE copySet copiedSet。
可以使用SCARD查看集合元素?cái)?shù)量候齿。當(dāng)然可以使用SRANDMEMBER 可以獲得隨機(jī)的元素熙暴,而不從sets刪除他們。
0.6 Redis Sorted sets
既像Sets又像Hashs慌盯, Sets部分周霉,就是保存了一系列唯一不重復(fù)的的String值。但是Sorted Sets 實(shí)現(xiàn)了element的排序亚皂,內(nèi)部是每個(gè)element會(huì)映射一個(gè)浮點(diǎn)型score用來(lái)排序俱箱。score來(lái)決定大小順序,如果score一樣則比較字典順序灭必。
zadd sorted_sets score key(可以設(shè)置多個(gè)) ,例如 zadd hackers 1940 "Alan Kay"
內(nèi)部實(shí)現(xiàn)是采用了兩個(gè)數(shù)據(jù)結(jié)構(gòu)狞谱,一個(gè)skip list和一個(gè)hash table。add操作LOG(N) 禁漓,讀取操作是常數(shù)時(shí)間的跟衅。
ZRANGE sorted_sets begin_index end_index讀取排好序的element ,從小到大播歼。
ZREVRANGE 逆序讀取伶跷。 可以選擇末尾增加WITHSCORES 選項(xiàng),同時(shí)顯示Score荚恶。
0.6.1 特殊操作 ZRANGEBYSCORE等
ZRANGEBYSCORE sorted_sets begin_score end_score撩穿, 例如:zrangebyscore hackers -inf 1950, with a score between negative infinity and 1950 (both extremes are included).
zremrangebyscore begin_score end_score 谒撼, 刪除指定范圍的元素食寡。
zrank & zrevrank 返回元素的排序位置。
0.6.2 Lexicographical scores字典順序score
使用方式廓潜,score一樣抵皱,所有的元素都是按照字典順序進(jìn)行排序。
ZRANGEBYLEX 辩蛋、ZREVRANGEBYLEX 按照字典獲取對(duì)應(yīng)范圍的元素呻畸,例如: zrangebylex hackers [B [P
可以使用reds sorted sets 做索引。
示例: 自動(dòng)補(bǔ)全demo悼院,
把linux內(nèi)核伤为,800W行unique代碼放到 1GB內(nèi)存中提供服務(wù)。
0.6.3 更新score
可以通過(guò)ZADD 相同的元素,實(shí)現(xiàn)更新score
場(chǎng)景:Leader Board
e.g., "you are the #4932 best score here"
0.7 Bitmaps
并不是一個(gè)真正的數(shù)據(jù)類型绞愚, 而是一系列在String 上的bit維度操作叙甸。有2^32不同bits,因?yàn)镾tring最大512MB位衩。
兩大類操作:1 常數(shù)時(shí)間單bit操作 2 針對(duì)一組bits的操作
Bitmaps最大的優(yōu)勢(shì)就是裆蒸,節(jié)省空間!例如糖驴,USER可以通過(guò)自增id來(lái)指示僚祷,可以維護(hù)single bit information (代表,每一bit贮缕,代表這個(gè)用戶是否想要接收新信息或其他選項(xiàng))辙谜, 40億客戶只需要使用512MB空間。
SETBIT bitmaps_name key value (takes as its first argument the bit number, and as its second argument the value to set the bit to)
GETBIT bitmaps_name key value
Redis會(huì)自動(dòng)擴(kuò)充代表bitmaps的 String 跷睦,如果bitmaps 的 key超過(guò)了當(dāng)前的String范圍筷弦。
0.7.1 operating on group of bits
BITOP performs bit-wise operations between different strings. The provided operations are AND, OR, XOR and NOT.
BITCOUNT 計(jì)數(shù)有多少bit被設(shè)置為1肋演,BITPOS 返回第一個(gè)bit 被設(shè)置為0或者1抑诸。他們兩個(gè)都可以傳入RANGE參數(shù),統(tǒng)計(jì)一段范圍爹殊。
使用場(chǎng)景
1 實(shí)時(shí)分析
2 和Object ID有關(guān)的高效boolean 信息
如:想要統(tǒng)計(jì)網(wǎng)站用戶訪問(wèn)最大的時(shí)間間隔蜕乡,count day 從0開始,之后用戶訪問(wèn)的時(shí)候梗夸,就拿時(shí)間戳-初始日期层玲,轉(zhuǎn)化為day力度,就是對(duì)應(yīng)的 BIT index反症,之后設(shè)置為1辛块。 每個(gè)用戶都有這么一個(gè)String Bitmap就可以方便進(jìn)行統(tǒng)計(jì)。直接BITCOUNT就可以統(tǒng)計(jì)客戶訪問(wèn)網(wǎng)站多少天铅碍。一些BITPOS調(diào)用就可以算出最長(zhǎng)的訪問(wèn)間隔润绵。
出于shading緣故,通常不會(huì)存一個(gè)非常長(zhǎng)的bitmaps胞谈,而是使用多個(gè)bitmaps尘盼,通常額策略就是每個(gè)bitmaps保存 M bits, bitmaps-key = bit-number/M and , 之后對(duì)應(yīng) bitmaps-key 中的位置 Nth bit=bit-number MOD M.
0.8 HyperLogLogs
概率結(jié)構(gòu)烦绳,來(lái)估算包含了多少元素卿捎。通常完成這個(gè)任務(wù)需要消耗大量?jī)?nèi)存,因?yàn)橐涗浵滤幸姷降脑鼐睹堋J褂靡恍┧惴ㄎ缯螅梢栽跇?biāo)準(zhǔn)誤差范圍內(nèi),提供高效的統(tǒng)計(jì)享扔,redis 誤差在1%以內(nèi)底桂,消耗的空間不超過(guò)12KB括细。內(nèi)部只是保存了一個(gè)state,并沒(méi)有真正保存元素(懷疑是使用類似bloom fliter類似算法)
HyperLogLogs(HLL)在Redis 內(nèi)部被編碼為String 戚啥,可以通過(guò)GET和SET來(lái)編碼和解碼HLL奋单。
概念上來(lái)說(shuō)HLL和 集合Set操作性質(zhì)一樣,SADD添加元素猫十,SCARD計(jì)算數(shù)量览濒。
PFADD 添加元素, PFCOUNT來(lái)統(tǒng)計(jì)大概的數(shù)據(jù)量拖云。
使用場(chǎng)景:
統(tǒng)計(jì)每天客戶有多少不同的查詢贷笛。