1. 什么是Futex
Futex 是Fast Userspace muTexes的縮寫灯荧,由Hubertus Franke, Matthew Kirkwood, Ingo Molnar and Rusty Russell共同設(shè)計(jì)完成渣玲。幾位都是linux領(lǐng)域的專家柏肪,其中可能Ingo Molnar大家更熟悉一些毒坛,畢竟是O(1)調(diào)度器和CFS的實(shí)現(xiàn)者佑吝。
Futex按英文翻譯過來就是快速用戶空間互斥體损谦。其設(shè)計(jì)思想其實(shí) 不難理解宪摧,在傳統(tǒng)的Unix系統(tǒng)中,System V IPC(inter process communication)氧骤,如 semaphores, msgqueues, sockets還有文件鎖機(jī)制(flock())等進(jìn)程間同步機(jī)制都是對(duì)一個(gè)內(nèi)核對(duì)象操作來完成的呻疹,這個(gè)內(nèi)核對(duì)象對(duì)要同步的進(jìn)程都是可見的,其提供了共享 的狀態(tài)信息和原子操作筹陵。當(dāng)進(jìn)程間要同步的時(shí)候必須要通過系統(tǒng)調(diào)用(如semop())在內(nèi)核中完成刽锤。可是經(jīng)研究發(fā)現(xiàn)朦佩,很多同步是無競(jìng)爭(zhēng)的并思,即某個(gè)進(jìn)程進(jìn)入 互斥區(qū),到再從某個(gè)互斥區(qū)出來這段時(shí)間语稠,常常是沒有進(jìn)程也要進(jìn)這個(gè)互斥區(qū)或者請(qǐng)求同一同步變量的宋彼。但是在這種情況下,這個(gè)進(jìn)程也要陷入內(nèi)核去看看有沒有人 和它競(jìng)爭(zhēng)仙畦,退出的時(shí)侯還要陷入內(nèi)核去看看有沒有進(jìn)程等待在同一同步變量上宙暇。這些不必要的系統(tǒng)調(diào)用(或者說內(nèi)核陷入)造成了大量的性能開銷。為了解決這個(gè)問 題议泵,F(xiàn)utex就應(yīng)運(yùn)而生占贫,F(xiàn)utex是一種用戶態(tài)和內(nèi)核態(tài)混合的同步機(jī)制。首先先口,同步的進(jìn)程間通過mmap共享一段內(nèi)存型奥,futex變量就位于這段共享 的內(nèi)存中且操作是原子的,當(dāng)進(jìn)程嘗試進(jìn)入互斥區(qū)或者退出互斥區(qū)的時(shí)候碉京,先去查看共享內(nèi)存中的futex變量厢汹,如果沒有競(jìng)爭(zhēng)發(fā)生,則只修改futex,而不 用再執(zhí)行系統(tǒng)調(diào)用了谐宙。當(dāng)通過訪問futex變量告訴進(jìn)程有競(jìng)爭(zhēng)發(fā)生烫葬,則還是得執(zhí)行系統(tǒng)調(diào)用去完成相應(yīng)的處理(wait 或者 wake up)。簡(jiǎn)單的說,futex就是通過在用戶態(tài)的檢查搭综,(motivation)如果了解到?jīng)]有競(jìng)爭(zhēng)就不用陷入內(nèi)核了垢箕,大大提高了low-contention時(shí)候的效率。 Linux從2.5.7開始支持Futex兑巾。
2. Futex系統(tǒng)調(diào)用
Futex是一種用戶態(tài)和內(nèi)核態(tài)混合機(jī)制条获,所以需要兩個(gè)部分合作完成,linux上提供了sys_futex系統(tǒng)調(diào)用蒋歌,對(duì)進(jìn)程競(jìng)爭(zhēng)情況下的同步處理提供支持帅掘。
其原型和系統(tǒng)調(diào)用號(hào)為
#include <linux/futex.h>
#include <sys/time.h>
int futex (int *uaddr, int op, int val, const struct timespec *timeout,int *uaddr2, int val3);
#define __NR_futex 240
雖然參數(shù)有點(diǎn)長(zhǎng),其實(shí)常用的就是前面三個(gè)堂油,后面的timeout大家都能理解修档,其他的也常被ignore。
uaddr:就是用戶態(tài)下共享內(nèi)存的地址府框,里面存放的是一個(gè)對(duì)齊的整型計(jì)數(shù)器吱窝。
op:存放著操作類型,如最基本的兩種 FUTEX_WAIT和FUTEX_WAKE寓免。
-
val:其具體含義由操作類型op決定。例如:
- FUTEX_WAIT: 原子性的檢查uaddr中計(jì)數(shù)器的值是否為val,如果是則讓進(jìn)程休眠计维,直到FUTEX_WAKE或者超時(shí)(time-out)袜香。也就是把進(jìn)程掛到uaddr相對(duì)應(yīng)的等待隊(duì)列上去。
- FUTEX_WAKE: 最多喚醒val個(gè)等待在uaddr上進(jìn)程鲫惶。
可見FUTEX_WAIT和FUTEX_WAKE只是用來掛起或者喚醒進(jìn)程蜈首,當(dāng)然這部分工作也只能在內(nèi)核態(tài)下完成。有些人嘗試著直接使用futex系統(tǒng)調(diào) 用來實(shí)現(xiàn)進(jìn)程同步欠母,并寄希望獲得futex的性能優(yōu)勢(shì)欢策,這是有問題的。應(yīng)該區(qū)分futex同步機(jī)制和futex系統(tǒng)調(diào)用赏淌。futex同步機(jī)制還包括用戶態(tài) 下的操作踩寇,我們將在下節(jié)提到。
3. Futex同步機(jī)制
所有的futex同步操作都應(yīng)該從用戶空間開始六水,首先創(chuàng)建一個(gè)futex同步變量俺孙,也就是位于共享內(nèi)存的一個(gè)整型計(jì)數(shù)器。
當(dāng) 進(jìn)程嘗試持有鎖或者要進(jìn)入互斥區(qū)的時(shí)候掷贾,對(duì)futex執(zhí)行"down"操作睛榄,即原子性的給futex同步變量減1。如果同步變量變?yōu)?想帅,則沒有競(jìng)爭(zhēng)發(fā)生场靴, 進(jìn)程照常執(zhí)行。如果同步變量是個(gè)負(fù)數(shù),則意味著有競(jìng)爭(zhēng)發(fā)生旨剥,需要調(diào)用futex系統(tǒng)調(diào)用的futex_wait操作休眠當(dāng)前進(jìn)程咧欣。
當(dāng)進(jìn)程釋放鎖或 者要離開互斥區(qū)的時(shí)候,對(duì)futex進(jìn)行"up"操作泞边,即原子性的給futex同步變量加1该押。如果同步變量由0變成1,則沒有競(jìng)爭(zhēng)發(fā)生阵谚,進(jìn)程照常執(zhí)行蚕礼。如 果加之前同步變量是負(fù)數(shù),則意味著有競(jìng)爭(zhēng)發(fā)生梢什,需要調(diào)用futex系統(tǒng)調(diào)用的futex_wake操作喚醒一個(gè)或者多個(gè)等待進(jìn)程奠蹬。
這里的原子性加減通常是用CAS(Compare and Swap)完成的,與平臺(tái)相關(guān)嗡午。CAS的基本形式是:CAS(addr,old,new),當(dāng)addr中存放的值等于old時(shí)囤躁,用new對(duì)其替換。在x86平臺(tái)上有專門的一條指令來完成它: cmpxchg荔睹。
可見: futex是從用戶態(tài)開始狸演,由用戶態(tài)和核心態(tài)協(xié)調(diào)完成的。
4. 進(jìn)/線程利用futex同步
進(jìn)程或者線程都可以利用futex來進(jìn)行同步僻他。
對(duì)于線程宵距,情況比較簡(jiǎn)單,因?yàn)榫€程共享虛擬內(nèi)存空間吨拗,虛擬地址就可以唯一的標(biāo)識(shí)出futex變量满哪,即線程用同樣的虛擬地址來訪問futex變量。
對(duì) 于進(jìn)程劝篷,情況相對(duì)復(fù)雜哨鸭,因?yàn)檫M(jìn)程有獨(dú)立的虛擬內(nèi)存空間,只有通過mmap()讓它們共享一段地址空間來使用futex變量娇妓。每個(gè)進(jìn)程用來訪問futex的 虛擬地址可以是不一樣的像鸡,只要系統(tǒng)知道所有的這些虛擬地址都映射到同一個(gè)物理內(nèi)存地址,并用物理內(nèi)存地址來唯一標(biāo)識(shí)futex變量哈恰。
小結(jié):
- Futex變量的特征:1)位于共享的用戶空間中 2)是一個(gè)32位的整型 3)對(duì)它的操作是原子的
- Futex在程序low-contention的時(shí)候能獲得比傳統(tǒng)同步機(jī)制更好的性能坟桅。
- 不要直接使用Futex系統(tǒng)調(diào)用。
- Futex同步機(jī)制可以用于進(jìn)程間同步蕊蝗,也可以用于線程間同步仅乓。
轉(zhuǎn)載地址:http://blog.csdn.net/Javadino/archive/2008/09/06/2891385.aspx