Linux RCU Q&A

Q1: Linux RCU是什么

A: Read-Copy-Update, 是Linux內(nèi)核里的一種"鎖"機制, 可以保證并發(fā)讀的時候基本無加鎖的等待, 不同于rwlock, RCU在寫入的時候也可以讀

Q2: RCU是如何執(zhí)行寫入操作的

A: RCU在寫入的時候, 采用以下步驟(需要修改的內(nèi)容在結(jié)構(gòu)體A內(nèi)):

新建一個結(jié)構(gòu)體, 將原結(jié)構(gòu)體A拷貝到新結(jié)構(gòu)體內(nèi)(Copy),
根據(jù)需要修改結(jié)構(gòu)體的內(nèi)容(Update),
然后將原來指向該結(jié)構(gòu)體的指針指向新的結(jié)構(gòu)體. 此時原結(jié)構(gòu)體A出現(xiàn)兩份
待所有讀操作完成后, 刪除原結(jié)構(gòu)體, 這樣結(jié)構(gòu)體A只有一份最新的

以鏈表為例:

初始狀態(tài): A--->B--->C
copy: B' = malloc(sizeof(B)); B' <= B
update: B'->x = value; 此時存在A, B, C和B', A--->B--->C, B'--->C, 這里借用了賦值操作的原子性
修改指針, 得到: A--->B'--->C, B--->C
待所有對于B的讀操作完成后, free(B), 此時變?yōu)锳--->B'--->C
由此可見寫操作的損耗是比較大的, 涉及到內(nèi)存分配, 內(nèi)存拷貝等操作

Q3: RCU是如何執(zhí)行讀操作的

A: 仍然以前面的鏈表為例:

在步驟4之前發(fā)生的讀操作, 獲取到的是B, 在讀操作期間, B不會被釋放, 讀操作可以正常完成
在步驟4之后發(fā)生的讀操作, 獲取到的是新的B', 同樣可以正常完成操作
只有在步驟4之前發(fā)生的讀操作完成后, B才會被釋放, 此時是安全的
由此可見讀操作完全可以并發(fā), 原則上是不需要加鎖的, RCU唯一要判斷的是"步驟4之前發(fā)生的讀操作完成"這一條件

Q4: 那么, 如何判斷讀操作已完成?

A: 內(nèi)核提供了兩個rcu api: rcu_read_lock和rcu_read_unlock, 兩者之間的內(nèi)容就是對于rcu保護對象的讀操作
前面鏈表例子的步驟5會釋放結(jié)構(gòu)體B, 如果此時對于B還有引用, 后續(xù)會導致異常, 因此這一步操作必須確認讀操作已經(jīng)調(diào)用rcu_read_unlock.
從代碼可以看出rcu_read_lock是關閉內(nèi)核搶占, 而rcu_read_unlock是打開內(nèi)核搶占, 因此RCU確保了讀操作期間內(nèi)核是禁用搶占的(對于當前這個CPU核), 那么寫操作在釋放原結(jié)構(gòu)體之前, 可以嘗試去搶占每個核, 如果每個核都能搶占到, 說明每個核的內(nèi)核搶占都打開著, 也說明所有的核都沒有正在讀的操作.
當然在輪詢每個核的時候, 已經(jīng)輪詢過的核, 有可能有新的讀操作又進來, 這是沒有關系的, 從前面鏈表操作可以看出, 步驟4已經(jīng)修改了鏈表, B'已經(jīng)占據(jù)了B的位置, 新的讀操作不會訪問到B
RCU提出的是一種機制, 輪詢只是一種實現(xiàn)方式, Linux內(nèi)核提供的相應接口為synchronize_rcu, 這個api會阻塞寫操作, 直到完成前面的檢測. 如果寫操作不允許阻塞, 如果不想阻塞, 可以調(diào)用call_rcu接口, 這種情況不會阻塞, 但是會注冊一個回調(diào)函數(shù), 當判斷讀操作全部完成時, 會調(diào)用回調(diào)函數(shù), 完成釋放指針之類的操作.
多核之間RCU讀寫流程如下:

CPU 0	CPU 1	CPU 2
rcu_read_lock()
	enters synchronize_rcu()
		rcu_read_lock()
rcu_read_unlock()
	exits synchronize_rcu()
		rcu_read_lock()

Q5: 并發(fā)寫操作是否要加鎖?

A: 從內(nèi)核文檔看, 寫操作在修改原指針的時候是需要加鎖的, 用spinlock即可, 主要是為了防止多個CPU核在更新結(jié)構(gòu)體時造成的沖突, 同樣以鏈表為例, 如果不加鎖, 在A--->B修改為A--->B'之前, 多個寫操作可能都得到的是B對象, 同時可能導致修改不一致的沖突出現(xiàn). 所以內(nèi)核里推薦的讀寫操作如下:

struct el {
  struct list_head list;
  long key;
  spinlock_t mutex;
  int data;
  /* Other data fields */
};
spinlock_t listmutex;
struct el head;
int search(long key, int *result)
{
  struct list_head *lp;
  struct el *p;
  rcu_read_lock();
  list_for_each_entry_rcu(p, head, lp) {
    if (p->key == key) {
      *result = p->data;
      rcu_read_unlock();
      return 1;
    }
  }
  rcu_read_unlock();
  return 0;
}
int delete(long key)
{
  struct el *p;
  spin_lock(&listmutex);
  list_for_each_entry(p, head, lp) {
    if (p->key == key) {
      list_del_rcu(&p->list);
      spin_unlock(&listmutex);
      synchronize_rcu();
      kfree(p);
      return 1;
    }
  }
  spin_unlock(&listmutex);
  return 0;
}

Q5: 還有什么其他API?

A: RCU還提供另外兩個基本的API: rcu_assign_pointer和rcu_dereference.
rcu_assign_pointer完成的是鏈表操作4中修改指針的操作, 將A--->B--->C改為A--->B'--->C:

rcu_assign_pointer(A->next, typeof(B') B');

rcu_dereference在讀操作獲取指針地址時使用:

    p = rcu_dereference(A->next);    
    return p->data;

對于一般的CPU如x86, arm, 這些操作實際上就是簡單的賦值

Q6: RCU有什么好處? 在哪用到?

A: 提供并發(fā)讀操作, 加鎖開銷可以忽略不計(實際上, 并沒有真正的讀加鎖過程), 但是寫操作開銷比較大, 因此特別適合讀多寫很少的場景. 最近在讀openvswitch的代碼, 流表操作大量用到RCU的功能.

Q7: 更詳細的文檔?

A: 內(nèi)核文檔/Documentation/RCU/whatisRCU.txt里就有詳細的說明, Is Parallel Programming Hard一書中同樣用大篇幅介紹了RCU

最后編輯于：2017.12.03 03:49:20

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖疲吸，帶你破解...
沈念sama閱讀 218,386評論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異，居然都是意外死亡赃承，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,142評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門悴侵，熙熙樓的掌柜王于貴愁眉苦臉地迎上來瞧剖，“玉大人，你說我怎么就攤上這事可免∽ビ冢” “怎么了？”我有些...
開封第一講書人閱讀 164,704評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵浇借，是天一觀的道長捉撮。經(jīng)常有香客問我，道長妇垢，這世上最難降的妖魔是什么巾遭？我笑而不...
開封第一講書人閱讀 58,702評論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮闯估，結(jié)果婚禮上恢总，老公的妹妹穿的比我還像新娘。我一直安慰自己睬愤，他們只是感情好片仿，可當我...
茶點故事閱讀 67,716評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著尤辱，像睡著了一般砂豌。火紅的嫁衣襯著肌膚如雪厢岂。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,573評論 1贊 305
城市分裂傳說
那天阳距，我揣著相機與錄音塔粒，去河邊找鬼。笑死筐摘，一個胖子當著我的面吹牛卒茬，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播咖熟，決...
沈念sama閱讀 40,314評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼圃酵，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了馍管？” 一聲冷哼從身側(cè)響起郭赐，我...
開封第一講書人閱讀 39,230評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎确沸，沒想到半個月后捌锭，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,680評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡罗捎，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,873評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年观谦，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片桨菜。...
茶點故事閱讀 39,991評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡豁状，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出雷激，到底是詐尸還是另有隱情，我是刑警寧澤告私，帶...
沈念sama閱讀 35,706評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布屎暇，位于F島的核電站，受9級特大地震影響驻粟，放射性物質(zhì)發(fā)生泄漏根悼。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,329評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一蜀撑、第九天我趴在偏房一處隱蔽的房頂上張望挤巡。院中可真熱鬧，春花似錦酷麦、人聲如沸矿卑。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,910評論 0贊 22
一樁弒父案沃饶，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽母廷。三九已至轻黑，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間琴昆，已是汗流浹背氓鄙。一陣腳步聲響...
開封第一講書人閱讀 33,038評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留业舍，地道東北人抖拦。一個月前我還...
沈念sama閱讀 48,158評論 3贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像舷暮，于是被迫代替她去往敵國和親态罪。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 44,941評論 2贊 355

Linux RCU Q&A

Linux RCU Q&A

Q1: Linux RCU是什么

Q2: RCU是如何執(zhí)行寫入操作的

Q3: RCU是如何執(zhí)行讀操作的

Q4: 那么, 如何判斷讀操作已完成?

Q5: 并發(fā)寫操作是否要加鎖?

Q5: 還有什么其他API?

Q6: RCU有什么好處? 在哪用到?

Q7: 更詳細的文檔?

推薦閱讀更多精彩內(nèi)容