Redis字符串可能是最常用(和濫用)的Redis數(shù)據(jù)結(jié)構(gòu)。它的主要優(yōu)勢(shì)之一是二進(jìn)制安全——這意味著你可以在Redis中保存任何類(lèi)型的二進(jìn)制數(shù)據(jù)辨赐。但在實(shí)際當(dāng)中,大多數(shù)Redis用戶(hù)會(huì)將對(duì)象序列化為JSON字符串镇防,再將它們存儲(chǔ)在Redis中股囊。
你可能會(huì)問(wèn)這有什么問(wèn)題呢?
- JSON序列化/反序列化非常低效和耗CPU
- 你最終會(huì)使用更多的存儲(chǔ)空間(這在Redis中是昂貴的谍婉,因?yàn)樗且粋€(gè)內(nèi)存數(shù)據(jù)庫(kù))
- 這增加了整體服務(wù)延遲舒憾,卻沒(méi)有任何實(shí)際好處。
在Redis中使用JSON存儲(chǔ)數(shù)據(jù)會(huì)增加延遲和資源使用穗熬,但不會(huì)帶來(lái)任何真正的好處镀迂。
您可以使用的另一個(gè)“簡(jiǎn)單”優(yōu)化方法是壓縮。這將取決于實(shí)際應(yīng)用場(chǎng)景唤蔗,因?yàn)樗鼘⒃谡加每臻g探遵、延遲和CPU使用之間進(jìn)行權(quán)衡。
像ZSTD或LZ4這樣的算法可以獲得最小的CPU開(kāi)銷(xiāo)妓柜,從而很好地節(jié)省了存儲(chǔ)空間箱季。
下面的實(shí)驗(yàn)顯示了從JSON轉(zhuǎn)換到二進(jìn)制格式(如MessagePack)所獲得的優(yōu)化。這些圖表包括序列化/反序列化時(shí)間棍掐。我們還可以看到藏雏,通過(guò)使用壓縮,我們可以增加一些延遲為代價(jià)來(lái)節(jié)省一些存儲(chǔ)/內(nèi)存作煌。
雖然前面的圖表顯示了LZ4可以很好地處理復(fù)雜的JSON對(duì)象(壓縮比)掘殴。當(dāng)我們需要壓縮浮點(diǎn)數(shù)數(shù)組時(shí),我們可以在下一個(gè)圖表中看到ZSTD的優(yōu)勢(shì)粟誓。
這里我使用不同大小的數(shù)組運(yùn)行基準(zhǔn)測(cè)試奏寨。
正如您所看到的,只需從JSON切換到MessagePack努酸,您就可以減少3倍以上的延遲,而且沒(méi)有任何真正的副作用!
以下是使用python來(lái)實(shí)現(xiàn)redis的字符串的set和get操作:
import msgpack
import redis
import json
data = {} # normal python dictionary with any values
r = redis.Redis(host='REDIS_HOST', port=6379, db=0)
# using json
r.set('foo_json', json.dumps(data))
json.loads(r.get('foo_json').decode('utf-8'))
# using msgpack
r.set('foo_msgpack', msgpack.packb(data))
msgpack.unpackb(r.get('foo_msgpack'))
MessagePack也有g(shù)olang的庫(kù):https://github.com/vmihailenco/msgpack