來自公眾號(hào):碼大叔
作者:劍圣
導(dǎo)讀:支持多線程的Redis6.0版本于2020-05-02終于發(fā)布了涧至,為什么Redis忽然要支持多線程?如何開啟多線程桑包?開啟后性能提升效果如何南蓬?線程數(shù)量該如何設(shè)置?開啟多線程后會(huì)不會(huì)有線程安全問題哑了?多線程的實(shí)現(xiàn)原理是怎樣的赘方?帶著這些疑問,我們來開啟Redis新特性-多線程連環(huán)13問弱左。
Redis 6.0 來了
在全國(guó)一片祥和IT民工歡度五一節(jié)假日的時(shí)候窄陡,Redis 6.0不聲不響地于5 月 2 日正式發(fā)布了,嚇得我趕緊從床上爬起來拆火,學(xué)無止境跳夭!學(xué)無止境!
對(duì)于6.0版本们镜,Redis之父Antirez在RC1版本發(fā)布時(shí)(2019-12-19)在他的博客上連續(xù)用了幾個(gè)“EST”詞語來評(píng)價(jià):
the most “enterprise” Redis version to date // 最”企業(yè)級(jí)”的
the largest release of Redis ever as far as I can tell // 最大的
the one where the biggest amount of people participated // 參與人數(shù)最多的
這個(gè)版本提供了諸多令人心動(dòng)的新特性及功能改進(jìn)优妙,比如新網(wǎng)絡(luò)協(xié)議RESP3,新的集群代理憎账,ACL等,其中關(guān)注度最高的應(yīng)該是“多線程”了卡辰,筆者也第一時(shí)間體驗(yàn)了一下胞皱,帶著眾多疑問,我們來一起開始“Redis 6.0 新特性-多線程連環(huán)13問”九妈。
Redis 6.0 多線程連環(huán)13問
1.Redis6.0之前的版本真的是單線程嗎反砌?
Redis在處理客戶端的請(qǐng)求時(shí),包括獲取 (socket 讀)萌朱、解析宴树、執(zhí)行、內(nèi)容返回 (socket 寫) 等都由一個(gè)順序串行的主線程處理晶疼,這就是所謂的“單線程”酒贬。但如果嚴(yán)格來講從Redis4.0之后并不是單線程又憨,除了主線程外,它也有后臺(tái)線程在處理一些較為緩慢的操作锭吨,例如清理臟數(shù)據(jù)蠢莺、無用連接的釋放、大 key 的刪除等等零如。
2.Redis6.0之前為什么一直不使用多線程躏将?
官方曾做過類似問題的回復(fù):使用Redis時(shí),幾乎不存在CPU成為瓶頸的情況考蕾, Redis主要受限于內(nèi)存和網(wǎng)絡(luò)祸憋。例如在一個(gè)普通的Linux系統(tǒng)上,Redis通過使用pipelining每秒可以處理100萬個(gè)請(qǐng)求肖卧,所以如果應(yīng)用程序主要使用O(N)或O(log(N))的命令蚯窥,它幾乎不會(huì)占用太多CPU。
使用了單線程后喜命,可維護(hù)性高沟沙。多線程模型雖然在某些方面表現(xiàn)優(yōu)異,但是它卻引入了程序執(zhí)行順序的不確定性壁榕,帶來了并發(fā)讀寫的一系列問題矛紫,增加了系統(tǒng)復(fù)雜度、同時(shí)可能存在線程切換牌里、甚至加鎖解鎖颊咬、死鎖造成的性能損耗。Redis通過AE事件模型以及IO多路復(fù)用等技術(shù)牡辽,處理性能非常高喳篇,因此沒有必要使用多線程。單線程機(jī)制使得 Redis 內(nèi)部實(shí)現(xiàn)的復(fù)雜度大大降低态辛,Hash 的惰性 Rehash麸澜、Lpush 等等 “線程不安全” 的命令都可以無鎖進(jìn)行。
3.Redis6.0為什么要引入多線程呢奏黑?
Redis將所有數(shù)據(jù)放在內(nèi)存中炊邦,內(nèi)存的響應(yīng)時(shí)長(zhǎng)大約為100納秒,對(duì)于小數(shù)據(jù)包熟史,Redis服務(wù)器可以處理80,000到100,000 QPS馁害,這也是Redis處理的極限了,對(duì)于80%的公司來說蹂匹,單線程的Redis已經(jīng)足夠使用了碘菜。
但隨著越來越復(fù)雜的業(yè)務(wù)場(chǎng)景,有些公司動(dòng)不動(dòng)就上億的交易量,因此需要更大的QPS忍啸。常見的解決方案是在分布式架構(gòu)中對(duì)數(shù)據(jù)進(jìn)行分區(qū)并采用多個(gè)服務(wù)器仰坦,但該方案有非常大的缺點(diǎn),例如要管理的Redis服務(wù)器太多吊骤,維護(hù)代價(jià)大缎岗;某些適用于單個(gè)Redis服務(wù)器的命令不適用于數(shù)據(jù)分區(qū);數(shù)據(jù)分區(qū)無法解決熱點(diǎn)讀/寫問題白粉;數(shù)據(jù)偏斜传泊,重新分配和放大/縮小變得更加復(fù)雜等等。
從Redis自身角度來說鸭巴,因?yàn)樽x寫網(wǎng)絡(luò)的read/write系統(tǒng)調(diào)用占用了Redis執(zhí)行期間大部分CPU時(shí)間眷细,瓶頸主要在于網(wǎng)絡(luò)的 IO 消耗, 優(yōu)化主要有兩個(gè)方向:
? 提高網(wǎng)絡(luò) IO 性能,典型的實(shí)現(xiàn)比如使用 DPDK 來替代內(nèi)核網(wǎng)絡(luò)棧的方式
? 使用多線程充分利用多核鹃祖,典型的實(shí)現(xiàn)比如 Memcached溪椎。
協(xié)議棧優(yōu)化的這種方式跟 Redis 關(guān)系不大,支持多線程是一種最有效最便捷的操作方式恬口。所以總結(jié)起來校读,redis支持多線程主要就是兩個(gè)原因:
? 可以充分利用服務(wù)器 CPU 資源,目前主線程只能利用一個(gè)核
? 多線程任務(wù)可以分?jǐn)?Redis 同步 IO 讀寫負(fù)荷
4.Redis6.0默認(rèn)是否開啟了多線程祖能?
Redis6.0的多線程默認(rèn)是禁用的歉秫,只使用主線程。如需開啟需要修改redis.conf配置文件:io-threads-do-reads yes
5.Redis6.0多線程開啟時(shí)养铸,線程數(shù)如何設(shè)置雁芙?
開啟多線程后,還需要設(shè)置線程數(shù)钞螟,否則是不生效的兔甘。同樣修改redis.conf配置文件
關(guān)于線程數(shù)的設(shè)置,官方有一個(gè)建議:4核的機(jī)器建議設(shè)置為2或3個(gè)線程鳞滨,8核的建議設(shè)置為6個(gè)線程洞焙,線程數(shù)一定要小于機(jī)器核數(shù)。還需要注意的是拯啦,線程數(shù)并不是越大越好澡匪,官方認(rèn)為超過了8個(gè)基本就沒什么意義了。
6.Redis6.0采用多線程后提岔,性能的提升效果如何?
Redis 作者 antirez 在 RedisConf 2019分享時(shí)曾提到:Redis 6 引入的多線程 IO 特性對(duì)性能提升至少是一倍以上笋敞。國(guó)內(nèi)也有大牛曾使用unstable版本在阿里云esc進(jìn)行過測(cè)試碱蒙,GET/SET 命令在4線程 IO時(shí)性能相比單線程是幾乎是翻倍了。
測(cè)試環(huán)境:
Redis Server: 阿里云 Ubuntu 18.04,8 CPU 2.5 GHZ, 8G 內(nèi)存赛惩,主機(jī)型號(hào) ecs.ic5.2xlarge
Redis Benchmark Client: 阿里云 Ubuntu 18.04哀墓,8 2.5 GHZ CPU, 8G 內(nèi)存,主機(jī)型號(hào) ecs.ic5.2xlarge
測(cè)試結(jié)果:
詳見:https://zhuanlan.zhihu.com/p/76788470
說明1:這些性能驗(yàn)證的測(cè)試并沒有針對(duì)嚴(yán)謹(jǐn)?shù)难訒r(shí)控制和不同并發(fā)的場(chǎng)景進(jìn)行壓測(cè)喷兼。數(shù)據(jù)僅供驗(yàn)證參考而不能作為線上指標(biāo)篮绰。
說明2:如果開啟多線程,至少要4核的機(jī)器季惯,且Redis實(shí)例已經(jīng)占用相當(dāng)大的CPU耗時(shí)的時(shí)候才建議采用吠各,否則使用多線程沒有意義。所以估計(jì)80%的公司開發(fā)人員看看就好勉抓。
7.Redis6.0多線程的實(shí)現(xiàn)機(jī)制贾漏?
流程簡(jiǎn)述如下:
1、主線程負(fù)責(zé)接收建立連接請(qǐng)求藕筋,獲取 socket 放入全局等待讀處理隊(duì)列
2纵散、主線程處理完讀事件之后,通過 RR(Round Robin) 將這些連接分配給這些 IO 線程
3隐圾、主線程阻塞等待 IO 線程讀取 socket 完畢
4伍掀、主線程通過單線程的方式執(zhí)行請(qǐng)求命令,請(qǐng)求數(shù)據(jù)讀取并解析完成暇藏,但并不執(zhí)行
5蜜笤、主線程阻塞等待 IO 線程將數(shù)據(jù)回寫 socket 完畢
6、解除綁定叨咖,清空等待隊(duì)列
(圖片來源:https://ruby-china.org/topics/38957)
該設(shè)計(jì)有如下特點(diǎn):
1瘩例、IO 線程要么同時(shí)在讀 socket,要么同時(shí)在寫甸各,不會(huì)同時(shí)讀或?qū)?/p>
2垛贤、IO 線程只負(fù)責(zé)讀寫 socket 解析命令,不負(fù)責(zé)命令處理
8.開啟多線程后趣倾,是否會(huì)存在線程并發(fā)安全問題聘惦?
從上面的實(shí)現(xiàn)機(jī)制可以看出,Redis的多線程部分只是用來處理網(wǎng)絡(luò)數(shù)據(jù)的讀寫和協(xié)議解析儒恋,執(zhí)行命令仍然是單線程順序執(zhí)行善绎。所以我們不需要去考慮控制 key、lua诫尽、事務(wù)禀酱,LPUSH/LPOP 等等的并發(fā)及線程安全問題。
9.Linux環(huán)境上如何安裝Redis6.0.1(6.0的正式版是6.0.1)牧嫉?
這個(gè)和安裝其他版本的redis沒有任何區(qū)別剂跟,整個(gè)流程跑下來也沒有任何的坑减途,所以這里就不做描述了。唯一要注意的就是配置多線程數(shù)一定要小于cpu的核心數(shù)曹洽,查看核心數(shù)量命令:
[root@centos7.5 ~]# lscpu
Architecture: x86_64
CPU op-mode(s): 32-bit, 64-bit
Byte Order: Little Endian
CPU(s): 4
On-line CPU(s) list: 0-3
10.Redis6.0的多線程和Memcached多線程模型進(jìn)行對(duì)比
前些年memcached 是各大互聯(lián)網(wǎng)公司常用的緩存方案鳍置,因此redis 和 memcached 的區(qū)別基本成了面試官緩存方面必問的面試題,最近幾年memcached用的少了送淆,基本都是 redis税产。不過隨著Redis6.0加入了多線程特性,類似的問題可能還會(huì)出現(xiàn)偷崩,接下來我們只針對(duì)多線程模型來簡(jiǎn)單比較一下辟拷。
如上圖所示:Memcached 服務(wù)器采用 master-woker 模式進(jìn)行工作,服務(wù)端采用 socket 與客戶端通訊环凿。主線程梧兼、工作線程 采用 pipe管道進(jìn)行通訊。主線程采用 libevent 監(jiān)聽 listen智听、accept 的讀事件羽杰,事件響應(yīng)后將連接信息的數(shù)據(jù)結(jié)構(gòu)封裝起來,根據(jù)算法選擇合適的工作線程到推,將連接任務(wù)攜帶連接信息分發(fā)出去考赛,相應(yīng)的線程利用連接描述符建立與客戶端的socket連接 并進(jìn)行后續(xù)的存取數(shù)據(jù)操作。
Redis6.0與Memcached多線程模型對(duì)比:
相同點(diǎn):都采用了 master線程-worker 線程的模型
不同點(diǎn):Memcached 執(zhí)行主邏輯也是在 worker 線程里莉测,模型更加簡(jiǎn)單颜骤,實(shí)現(xiàn)了真正的線程隔離,符合我們對(duì)線程隔離的常規(guī)理解捣卤。而 Redis 把處理邏輯交還給 master 線程忍抽,雖然一定程度上增加了模型復(fù)雜度,但也解決了線程并發(fā)安全等問題董朝。
11.Redis作者是如何點(diǎn)評(píng) “多線程”這個(gè)新特性的鸠项?
關(guān)于多線程這個(gè)特性,在6.0 RC1時(shí)子姜,Antirez曾做過說明:
Redis支持多線程有2種可行的方式:第一種就是像“memcached”那樣祟绊,一個(gè)Redis實(shí)例開啟多個(gè)線程,從而提升GET/SET等簡(jiǎn)單命令中每秒可以執(zhí)行的操作哥捕。這涉及到I/O牧抽、命令解析等多線程處理,因此遥赚,我們將其稱之為“I/O threading”扬舒。另一種就是允許在不同的線程中執(zhí)行較耗時(shí)較慢的命令,以確保其它客戶端不被阻塞凫佛,我們將這種線程模型稱為“Slow commands threading”讲坎。
經(jīng)過深思熟慮泽腮,Redis不會(huì)采用“I/O threading”,redis在運(yùn)行時(shí)主要受制于網(wǎng)絡(luò)和內(nèi)存衣赶,所以提升redis性能主要是通過在多個(gè)redis實(shí)例,特別是redis集群厚满。接下來我們主要會(huì)考慮改進(jìn)兩個(gè)方面:
1. Redis集群的多個(gè)實(shí)例通過編排能夠合理地使用本地實(shí)例的磁盤府瞄,避免同時(shí)重寫AOF。
2.提供一個(gè)Redis集群代理碘箍,便于用戶在沒有較好的集群協(xié)議客戶端時(shí)抽象出一個(gè)集群遵馆。
補(bǔ)充說明一下,Redis和memcached一樣是一個(gè)內(nèi)存系統(tǒng)丰榴,但不同于Memcached货邓。多線程是復(fù)雜的,必須考慮使用簡(jiǎn)單的數(shù)據(jù)模型四濒,執(zhí)行LPUSH的線程需要服務(wù)其他執(zhí)行LPOP的線程换况。
我真正期望的實(shí)際是“slow operations threading”,在redis6或redis7中盗蟆,將提供“key-level locking”戈二,使得線程可以完全獲得對(duì)鍵的控制以處理緩慢的操作。
詳見:http://antirez.com/news/126
12.Redis線程中經(jīng)常提到IO多路復(fù)用喳资,如何理解觉吭?
這是IO模型的一種,即經(jīng)典的Reactor設(shè)計(jì)模式仆邓,有時(shí)也稱為異步阻塞IO鲜滩。
多路指的是多個(gè)socket連接,復(fù)用指的是復(fù)用一個(gè)線程节值。多路復(fù)用主要有三種技術(shù):select徙硅,poll,epoll察署。epoll是最新的也是目前最好的多路復(fù)用技術(shù)闷游。采用多路 I/O 復(fù)用技術(shù)可以讓單個(gè)線程高效的處理多個(gè)連接請(qǐng)求(盡量減少網(wǎng)絡(luò)IO的時(shí)間消耗),且Redis在內(nèi)存中操作數(shù)據(jù)的速度非程簦快(內(nèi)存內(nèi)的操作不會(huì)成為這里的性能瓶頸)脐往,主要以上兩點(diǎn)造就了Redis具有很高的吞吐量。
13.你知道Redis的彩蛋LOLWUT嗎扳埂?
這個(gè)其實(shí)從Redis5.0就開始有了业簿,但是原諒我剛剛知道。作者是這么描述這個(gè)功能的《LOLWUT: a piece of art inside a database command》阳懂,“數(shù)據(jù)庫(kù)命令中的一件藝術(shù)品”梅尤。你可以把它稱之為情懷柜思,也可以稱之為彩蛋,具體是什么巷燥,我就不透露了赡盘。和我一樣不清楚是什么的小伙伴可以參見:http://antirez.com/news/123,每次運(yùn)行都會(huì)隨機(jī)生成的噢缰揪。
參考陨享、致謝
Rdis作者Antirez的博客:http://antirez.com
https://www.zhihu.com/question/26943938/answer/68773398
https://zhuanlan.zhihu.com/p/76788470
http://www.web-lovers.com/redis-source-6-rc-mult-thread.html
https://ruby-china.org/topics/38957
https://redis.io/topics/faq#redis-is-single-threaded-how-can-i-exploit-multiple-cpu--cores
https://juejin.im/post/5e9ae485f265da47b04d95d2
https://www.cnblogs.com/gattaca/p/6929361.html
本文圖片來自互聯(lián)網(wǎng),版權(quán)歸原作者所有