線程安全(thread safety)是指在多線程環(huán)境下厘擂,不同的線程在同一時(shí)刻能夠安全訪問臨界區(qū)的能力,它可以讓代碼沒有副作用地實(shí)現(xiàn)想要的功能。
可重入(reentrancy)是指一個(gè)函數(shù)如果在執(zhí)行過程中被中斷顾复,當(dāng)中斷完成后又可以安全地進(jìn)入上次中斷點(diǎn)重新執(zhí)行的能力。它有兩種語義:
- 在多線程環(huán)境下枫绅,一個(gè)線程因時(shí)間片使用完了(或者其他原因)泉孩,另一個(gè)線程開始運(yùn)行,接著該線程又安全地重新開始運(yùn)行并淋。在這種語境下寓搬,可重入等同于線程安全。
- 在單線程的信號(hào)處理環(huán)境下县耽,一個(gè)函數(shù)在運(yùn)行過程中句喷,此時(shí)異步來了個(gè)信號(hào),控制流便轉(zhuǎn)向了信號(hào)處理函數(shù)兔毙,當(dāng)信號(hào)處理函數(shù)完成后該函數(shù)又可以安全地重新運(yùn)行唾琼。在這種語境下,可重入又被稱為異步信號(hào)安全(async-signal safety)澎剥。
當(dāng)提到可重入的時(shí)候锡溯,我們一般指的是后者。
可重入
為了使函數(shù)達(dá)到可重入肴裙,需要遵循一定的規(guī)則趾唱,如下
- 不要包含靜態(tài)數(shù)據(jù),不要使用全局?jǐn)?shù)據(jù)蜻懦。
int global_var{10};
int NotReentrant()
{
global_var = 20;
// 在這里來了個(gè)信號(hào)
return global_var;
}
如上所示甜癞,如果給 global_var 賦值之后來了個(gè)信號(hào),在信號(hào)處理函數(shù)中又對(duì) global_var 賦了不同的值宛乃,那么從信號(hào)處理函數(shù)返回到 NotReentrant 中悠咱,global_var 的值就不再是我們期望的值,因此該函數(shù)是不可重入的征炼。
這個(gè)例子比較直觀析既,信號(hào)也可能在一些不太直觀的地方中發(fā)送過來。例如谆奥,在一個(gè) 32 位的機(jī)器上操作 64 位的數(shù)據(jù)眼坏,這個(gè)操作可能就要被分為兩個(gè) 32 位的操作,而在這兩個(gè)操作之間酸些,信號(hào)就有可能被發(fā)送過來宰译;對(duì)于 global_var = f() + g();
,f() 和 g() 發(fā)生的先后順序是不確定的魄懂,而且信號(hào)也可能在兩個(gè)函數(shù)之間被發(fā)送過來沿侈。
- 不要使用 new(malloc)或 delete(free)。
不同實(shí)現(xiàn)中的 new 是不同的市栗,可以是線程安全的也可以是線程不安全的缀拭,但無論如何都是不可重入的咳短。
先假設(shè)它是線程不安全的。new 通常為它在堆上分配的存儲(chǔ)區(qū)維護(hù)一個(gè)鏈表蛛淋,而當(dāng)信號(hào)來的時(shí)候咙好,線程可能正在修改此鏈表,而信號(hào)處理函數(shù)中也可能調(diào)用了 new铣鹏,也要修改鏈表敷扫,這就造成了沖突。因此線程不安全的 new 是不可重入的诚卸。
再假設(shè)它是線程安全的葵第。這時(shí)候就要在修改鏈表的地方加上鎖,如果在加上鎖之后但還沒有修改完鏈表的時(shí)候來了個(gè)信號(hào)合溺,在信號(hào)處理函數(shù)中也調(diào)用了 new卒密,也要加上鎖,如果該鎖不是遞歸的棠赛,那么該線程將會(huì)永久地等待該鎖的釋放哮奇,無法將控制流返回到之前的函數(shù)中。因此線程安全的 new 也是不可重入的睛约。
在本文的測(cè)試環(huán)境中(Ubuntu-16.04-64bit GCC-5.4.0)鼎俘,new(malloc)和 delete(malloc)都是線程安全的。
- 不要使用不可重入的函數(shù)辩涝。
特別需要注意的是標(biāo)準(zhǔn) I/0 函數(shù)贸伐,標(biāo)準(zhǔn) I/O 庫中的很多實(shí)現(xiàn)都以不可重入方式使用了全局?jǐn)?shù)據(jù)。若標(biāo)準(zhǔn) I/O 指向的是終端怔揩,則它是行緩沖的捉邢,否則是全緩沖的。例如對(duì)于 printf商膊,并不是調(diào)用它就會(huì)立即將全局緩沖數(shù)據(jù)沖洗(flush)伏伐,而是當(dāng)遇到了換行符(行緩沖)或者是緩沖區(qū)滿了(全緩沖)才會(huì)將數(shù)據(jù)傳送。由于使用了全局?jǐn)?shù)據(jù)晕拆,因此 printf 是不可重入的藐翎,不能將它用在可重入的函數(shù)中。
在本文的測(cè)試環(huán)境下实幕,有些函數(shù)是不可重入的阱高,例如 strerror 和 readdir,但是系統(tǒng)提供了可重入的版本 strerror_r 和 readdir_r(后綴 r 表示 reentrant)茬缩,這些可重入版本不再使用靜態(tài)數(shù)據(jù),而是需要調(diào)用者提供由自己管理的存儲(chǔ)空間吼旧。
信號(hào)處理函數(shù)也需要是可重入的凰锡,當(dāng)控制流在信號(hào)處理函數(shù) A 中時(shí),也可能會(huì)有另外的信號(hào)發(fā)送過來,如果此時(shí)的信號(hào)屏蔽字沒有將該信號(hào)屏蔽掉掂为,那么就會(huì)轉(zhuǎn)到相應(yīng)的信號(hào)處理函數(shù) B 中裕膀,如果信號(hào)處理函數(shù) A 和 B 都修改了同一個(gè)全局變量,那么結(jié)果將會(huì)是意料之外的勇哗。
對(duì)于以上的規(guī)則昼扛,errno 是一個(gè)例外,每個(gè)線程都會(huì)有自己的 errno欲诺,Single UNIX Specification 中要求的可重入函數(shù)(詳見 APUE 第三版 10.6)也可能會(huì)出錯(cuò)抄谐,從而修改了 errno,但是依然認(rèn)為這些函數(shù)是可重入的扰法,所以如果在信號(hào)處理函數(shù)中調(diào)用了這些函數(shù)蛹含,需要在該信號(hào)處理函數(shù)開始的位置保存 errno,在函數(shù)的末尾再把保存的值重新賦給 errno塞颁。
可重入與線程安全的區(qū)別
我們經(jīng)常將可重入與線程安全視為相同的浦箱,但是它們之間還是有細(xì)微的差別。在多線程環(huán)境下祠锣,可重入即為線程安全酷窥;但是更常使用的語境是單線程的信號(hào)處理,因?yàn)闈M足了上述可重入的三個(gè)規(guī)則的函數(shù)伴网,大多同時(shí)也是線程安全的蓬推,所以通常并不對(duì)其進(jìn)行區(qū)分,但是也會(huì)有特殊的情況是偷。
是可重入?yún)s是線程不安全
int global_var{20};
void Swap(int* lhs, int* rhs)
{
int save{global_var};
global_var = *lhs;
*lhs = *rhs;
// 假如信號(hào)在此時(shí)傳來
*rhs = global_var;
global_var = save;
}
這種做法就類似與上文對(duì) errno 的處理拳氢,先將 global_var 保存起來,在末尾的地方再還回去蛋铆。如果信號(hào)在 Swap 中途傳來馋评,也不用擔(dān)心控制流重新回來的時(shí)候 global_var 會(huì)發(fā)生改變,因此是可重入的刺啦;但是由于沒有對(duì)臨界區(qū)鎖起來留特,這個(gè)函數(shù)就是線程不安全的。
是線程安全卻是不可重入
上文中的線程安全的 new 就是一個(gè)例子玛瘸。
參考
[1] Reentrancy(computing)
[2] Thread safety
[3] why are malloc and printf said as non-reentrant