在io多路復(fù)用中,有三個(gè)主要操作束析。
epoll_create
接口描述
int epoll_create(int size);
創(chuàng)建epoll的句柄艳馒,size是監(jiān)聽的數(shù)目,這個(gè)參數(shù)不同于select()中的第一個(gè)參數(shù)员寇,給出最大監(jiān)聽的fd+1的值鹰溜,參數(shù)size并不是限制了epoll所能監(jiān)聽的描述符最大個(gè)數(shù),只是對(duì)內(nèi)核初始分配內(nèi)部數(shù)據(jù)結(jié)構(gòu)的一個(gè)建議丁恭。
當(dāng)創(chuàng)建好epoll句柄后曹动,它就會(huì)占用一個(gè)fd值,在linux下如果查看/proc/進(jìn)程id/fd/牲览,是能夠看到這個(gè)fd的墓陈,所以在使用完epoll后,必須調(diào)用close()關(guān)閉第献,否則可能導(dǎo)致fd被耗盡贡必。
epoll_ctl
接口描述
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
對(duì)指定描述符fd執(zhí)行op操作
接口參數(shù)解釋
- epfd:是epoll_create()的返回值庸毫。
- op:表示op操作仔拟,用三個(gè)宏來表示:添加EPOLL_CTL_ADD,刪除EPOLL_CTL_DEL飒赃,修改EPOLL_CTL_MOD利花。分別添加科侈、刪除和修改對(duì)fd的監(jiān)聽事件。
- fd:是需要監(jiān)聽的fd(文件描述符)
- epoll_event:是告訴內(nèi)核需要監(jiān)聽什么事炒事,struct epoll_event結(jié)構(gòu)如下:
struct epoll_event {
__uint32_t events; /* Epoll events */
epoll_data_t data; /* User data variable */
};
events可以是以下幾個(gè)宏的集合:
EPOLLIN :表示對(duì)應(yīng)的文件描述符可以讀(包括對(duì)端SOCKET正常關(guān)閉)臀栈;
EPOLLOUT:表示對(duì)應(yīng)的文件描述符可以寫;
EPOLLPRI:表示對(duì)應(yīng)的文件描述符有緊急的數(shù)據(jù)可讀(這里應(yīng)該表示有帶外數(shù)據(jù)到來)挠乳;
EPOLLERR:表示對(duì)應(yīng)的文件描述符發(fā)生錯(cuò)誤权薯;
EPOLLHUP:表示對(duì)應(yīng)的文件描述符被掛斷;
EPOLLET: 將EPOLL設(shè)為邊緣觸發(fā)(Edge Triggered)模式睡扬,這是相對(duì)于水平觸發(fā)(Level Triggered)來說的盟蚣。
EPOLLONESHOT:只監(jiān)聽一次事件,當(dāng)監(jiān)聽完這次事件之后卖怜,如果還需要繼續(xù)監(jiān)聽這個(gè)socket的話屎开,需要再次把這個(gè)socket加入到EPOLL隊(duì)列里
epoll_wait
接口描述
int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
等待epfd上的io事件,最多返回maxevents個(gè)事件韧涨。
參數(shù)events用來從內(nèi)核得到事件的集合,maxevents告之內(nèi)核這個(gè)events有多大侮繁,這個(gè)maxevents的值不能大于創(chuàng)建epoll_create()時(shí)的size虑粥。
參數(shù)timeout是超時(shí)時(shí)間,毫秒宪哩,0會(huì)立即返回娩贷,非零則會(huì)
1.忙輪訓(xùn)一個(gè)固定時(shí)間(1ms),
2.忙輪訓(xùn)超時(shí)時(shí)間過去锁孟,則進(jìn)入可中斷休眠狀態(tài)彬祖,等待喚醒條件)
3.可中斷休眠狀態(tài),被喚醒時(shí)品抽,若操作超時(shí)時(shí)間到了储笑,或者內(nèi)容ready,則返回需要處理的事件數(shù)目圆恤,如返回0表示已超時(shí)突倍。
epoll_wait 源碼分析
源碼為C語(yǔ)言,此處僅摘取部分邏輯代碼并加以解釋
def ep():
if (timeout > 0) {
set_timeout_attr // 設(shè)置忙輪訓(xùn)超時(shí)時(shí)間屬性盆昙,設(shè)置整個(gè)操作的超時(shí)時(shí)間屬性
} else if (timeout == 0) {
ep_events_available(ep)
goto send_events # 如果timeout 設(shè)置為零羽历,則直接獲取然后將結(jié)果返回。結(jié)果包括1. 獲取成功淡喜,返回等待的個(gè)數(shù)秕磷。2.獲取失敗,返回失敗的code
}
fetch_events:
if(!ep_events_available(ep))
ep_busy_loop(ep, timed_out) # 如果此時(shí)炼团,沒有事件就緒澎嚣,且為阻塞疏尿,就去忙輪訓(xùn),直到超時(shí)(1ms币叹,與設(shè)置的超時(shí)時(shí)間不同润歉,這里是忙輪訓(xùn)的超時(shí)時(shí)間)或者有事件返回
if (eavail)
goto send_events;
for (;;) {
set_current_state(TASK_INTERRUPTIBLE) # 可中斷睡眠狀態(tài)直到某些條件達(dá)成被喚醒,這里條件的檢查由調(diào)度器完成颈抚,比如說檢查信號(hào)量來同步狀態(tài)等踩衩, identifies a process that is suspended (sleeping) until some condition becomes true.
}
if (pending or fatal_signal)
break
if (eavail)
break
if (timeout) # 操作超時(shí)時(shí)間到了
break
return res
附:
linux (本文使用linux4.8.4) 下進(jìn)程狀態(tài),大致有7種贩汉。
進(jìn)程狀態(tài) 說明
TASK_RUNNING 可運(yùn)行狀態(tài)驱富。未必正在使用CPU,也許是在等待調(diào)度
TASK_INTERRUPTIBLE 可中斷的睡眠狀態(tài)匹舞。正在等待某個(gè)條件滿足
TASK_UNINTERRUPTIBLE 不可中斷的睡眠狀態(tài)褐鸥。不會(huì)被信號(hào)中斷
__TASK_STOPPED 暫停狀態(tài)。收到某種信號(hào)赐稽,運(yùn)行被停止
__TASK_TRACED 被跟蹤狀態(tài)叫榕。進(jìn)程停止,被另一個(gè)進(jìn)程跟蹤
EXIT_ZOMBIE 僵尸狀態(tài)姊舵。進(jìn)程已經(jīng)退出晰绎,但尚未被父進(jìn)程或者init進(jìn)程收尸
EXIT_DEAD 真正的死亡狀態(tài)
在include/linux/sched.h中,進(jìn)程狀態(tài)的定義并沒有那么少:
本文參考:
linux 中進(jìn)程的狀態(tài)
linux eventpoll內(nèi)核代碼
Linux IO模式及 select括丁、poll荞下、epoll詳解