前言
面試的時候經(jīng)常會問為什么redis單線程脸爱,性能那么高畴蹭?于是很多培訓(xùn)機(jī)構(gòu)的老師說是因為IO多路復(fù)用,于是就硬背回答谋币,結(jié)果面試官也給你過了暑竟,可是到底什么是IO多路復(fù)用斋射?仍然一知半解,下面我用實際抓包工具來談?wù)処O多路復(fù)用但荤。
redis IO多路復(fù)用
這個圖應(yīng)該是講redis IO多路復(fù)用的老演員了罗岖。但是靠這個講明白IO多路復(fù)用,我個人覺得是不合適的腹躁。因為他沒體現(xiàn)出redis的單線程桑包。
什么是socket
在談IO多路復(fù)用時,我們需要做一下前期知識的鋪墊纺非。我們知道哑了,進(jìn)行網(wǎng)絡(luò)通信時,需要三次握手建立TCP連接烧颖,建立連接后我們可以通過socket進(jìn)行通信弱左。那么socket是什么東西呢?
socket翻譯就是插座的意思炕淮,如圖所示拆火,我客戶端的插頭插到服務(wù)端的插座上,就建立起了連接進(jìn)行通信。那么這個插座插頭對應(yīng)到我們的操作系統(tǒng)是什么呢榜掌?其實就是一個文件优妙,這個文件的文件類型是socket(后續(xù)會給大家看這個文件)。在我們的應(yīng)用程序中憎账,我們打開文件比如file.open(xxx),會返回給我們一個整數(shù)套硼,這個整數(shù)叫做文件描述符(或者文件句柄)。我們可以用這個文件句柄來對文件進(jìn)行操作胞皱。所以我們可以知道邪意,當(dāng)我們連接通信是通過TCP時,TCP對應(yīng)到我們實際操作系統(tǒng)時反砌,就會客戶端 服務(wù)端各打開一個socket文件雾鬼。所以比如我redis有五個客戶端連接,那么我服務(wù)端就會有五個socket文件宴树。
安裝redis服務(wù)端
#下載二進(jìn)制包
wget http://download.redis.io/releases/redis-4.0.10.tar.gz
#解壓
tar xzf redis-4.0.10.tar.gz
cd redis-4.0.10/
#編譯 可能會報錯 記得先裝gcc相關(guān)工具 具體我懶得寫 網(wǎng)上安裝redis一大堆
make
#啟動 記得把redis.conf改為可以外部連接 同時關(guān)閉防火墻
cd src
./redis-server ../redis.conf
記得redis用二進(jìn)制安裝策菜,不要用docker,docker有自身的網(wǎng)絡(luò)協(xié)議棧,測試起來比較麻煩酒贬。當(dāng)我們把redis啟動后我們使用命令又憨,查看下tcp連接數(shù)
netstat -na|grep ESTABLISHED
我們可以看到這個redis服務(wù)端已經(jīng)有4個tcp連接了,客戶端分別是192.168.110.105:55343锭吨,172.17.0.5:60554等等蠢莺。
同樣,我們看看這個對應(yīng)的socket的文件數(shù)量零如。
#找到redis的pid
ps -ef |grep redis
#填上redis的pid 查看這個進(jìn)程的文件描述符
cd /proc/{pid}/fd
#列出進(jìn)程內(nèi)所有文件
ll
我們可以看到很多的socket文件和管道文件躏将。這個socket文件和客戶端連接數(shù)不一致原因,是因為我比較懶考蕾,隨便截的圖祸憋。所以你們自己測試時,添加一個客戶端連接就會多一個socket辕翰。
然后我們使用命令打開tcpdump抓包夺衍,查看連接過程
#監(jiān)聽服務(wù)端redis的網(wǎng)絡(luò)數(shù)據(jù)包
tcpdump port 6379 and dst 192.168.140.185
可以看到 我們左側(cè) 直接通過命令 ”nc 192.168.140.185 6379“連接到服務(wù)端,發(fā)送消息喜命。你們自己去嘗試時會發(fā)現(xiàn)沟沙,nc連接時,socket增加了壁榕,tcp連接也增加了矛紫。
什么是IO多路復(fù)用
好了,我們知道了客戶端和服務(wù)端是怎么連接的牌里,那么現(xiàn)在看看IO多路復(fù)用颊咬。IO多路復(fù)用有三個函數(shù)务甥,select、poll喳篇、epoll我們看下這三個函數(shù)是什么敞临?具體的可以在linux使用 ”man 2 epoll“查看。我們知道了很多客戶端連接時麸澜,有很多的fd文件描述符挺尿。IO多路復(fù)用就是我把一堆的文件描述符給epoll函數(shù),然后這個函數(shù)查找這些文件里有沒有客戶端寫入數(shù)據(jù)炊邦,有的話编矾,就把這些文件描述符返回。再循環(huán)的去讀取數(shù)據(jù)馁害。
回到我們redis IO多路復(fù)用窄俏,我很多的客戶端連接redis服務(wù)端,有很多的文件描述符碘菜,我調(diào)用epoll函數(shù)凹蜈,得到那些有數(shù)據(jù)的文件描述符。然后單線程循環(huán)這些文件描述符炉媒,根據(jù)文件描述符讀出客戶端的指令踪区,單線程進(jìn)行執(zhí)行。因為redis操作內(nèi)存而且數(shù)據(jù)結(jié)構(gòu)設(shè)計很合理吊骤,所以每行指令執(zhí)行速度很快,cpu對于性能影響不大静尼,所以單線程也很高性能白粉。
下面是一段這個過程的偽代碼,當(dāng)然實際的代碼和這個差別很大鼠渺,為了便于理解這個過程鸭巴,整體大概流程如下,實際流程跟這個還是有區(qū)別的拦盹。
#得到有數(shù)據(jù)的文件描述符
var fds=epoll(socketfd1,socketfd2,socketfd3.......socketfd1024);
#循環(huán)文件描述符
for(int i=0;i<fds.count;i++)
{
var commond=fds[i].read(); #讀出指令 set name zhangsan
#執(zhí)行指令
command.excute();
}
總結(jié)
本篇文章寫的很粗糙鹃祖,這個確實最近太忙了,所以懶得寫東西普舆,但是整體思路是這樣的恬口,可以按照上述命令和方法進(jìn)行嘗試