為什么Go1.1從G-M模型轉(zhuǎn)變成G-M-P模型蟋字？

翻譯至：[Scalable Go Scheduler Design Doc]--DmitryVyukov (https://docs.google.com/document/d/1TTj4T2JO42uD5ID9e89oa0sLKhJYD0Y_kqxDv3I3XMw/edit#heading=h.mmq8lm48qfcw)

當(dāng)前調(diào)度器的問(wèn)題

??當(dāng)前的goroutine調(diào)度器限制了用go編寫(xiě)編發(fā)程序的可伸縮性,特別是高吞吐量服務(wù)和并行計(jì)算程序。Vtocc (https://github.com/vitessio/vitess]服務(wù)在8核機(jī)子上的最大CPU消耗為70%,profile顯示在runtime.futex()函數(shù)花費(fèi)了14%虑凛。通常翎碑，調(diào)度器會(huì)禁止用戶使用慣用的細(xì)顆粒度的并發(fā)裆甩，這對(duì)性能至關(guān)重要。

目前的實(shí)現(xiàn)存在以下問(wèn)題:

1.單個(gè)全局互斥鎖(Schd.Lock)和集中的狀態(tài)潘悼。此鎖保護(hù)所有與goroutine有關(guān)的操作(創(chuàng)建律秃，完成，重新調(diào)度等)
2.Goroutine(G) 間的交替 (G.nextg)治唤。工作線程(M)頻繁地切換可運(yùn)行的goroutine,這可能導(dǎo)致延遲增加和額外的開(kāi)銷棒动。每個(gè)M必須能夠執(zhí)行任務(wù)可運(yùn)行的G,特別是剛剛創(chuàng)建G的M。
1. Per-M 內(nèi)存緩存(M.mcache)宾添。內(nèi)存緩存與其他緩存(堆棧分配)都與所有M相關(guān)聯(lián),而其實(shí)它們只需要與運(yùn)行Go代碼的M相關(guān)聯(lián)(在syscall內(nèi)部阻塞的M其實(shí)并不需要mcache)船惨。運(yùn)行Go代碼的M與所有M的比率高達(dá)1:100。這導(dǎo)致過(guò)多的資源消耗(每個(gè)MCache最多可以到2M)和槽糕的數(shù)據(jù)局部性辞槐。
1. 過(guò)于積極的線程阻塞/解除阻塞掷漱。在系統(tǒng)調(diào)度時(shí),工作線程經(jīng)常被阻塞和解除阻塞。這增加了很多開(kāi)銷榄檬。

設(shè)計(jì)

Processors

??普遍的想法是將P(Processors處理器)的概念引入運(yùn)行時(shí)卜范，并在處理器智之上實(shí)現(xiàn)work-stealing scheduler(工作竊取調(diào)度)http://supertech.csail.mit.edu/papers/steal.pdf程序

??M表示OS線程鹿榜。P表示執(zhí)行Go代碼所需的資源海雪。當(dāng)M執(zhí)行Go代碼時(shí),它有一個(gè)關(guān)聯(lián)的P。
當(dāng)M空閑或在系統(tǒng)調(diào)用時(shí)舱殿，它需要獲取P奥裸。

??我們擁有與GOMAXPROCS 相同數(shù)量的P。所有的P都被組織成一個(gè)數(shù)組沪袭，這是為了實(shí)現(xiàn)work-stealing工作竊取的要求湾宙。GOMAXPROCS 更改設(shè)計(jì) stop/start the world 來(lái)重新調(diào)整P的數(shù)組。來(lái)自sched的一些變量被分散并移動(dòng)到P，來(lái)自M的一些變量也被移動(dòng)到P（與Go代碼的主動(dòng)執(zhí)行相關(guān)的變量）

struct P
{
  Lock;
  G *gfree; // freelist, moved from sched
  G *ghead; // runnable, moved from sched
  G *gtail;
  MCache *mcache; // moved from M
  FixAlloc *stackalloc; // moved from M
  uint64 ncgocall;
  GCStats gcstats;
  // etc
...
};

P *allp; // [GOMAXPROCS]

還有一個(gè)無(wú)鎖的空閑P列表：

P *idlep; // lock-free list

??當(dāng)M開(kāi)始執(zhí)行Go代碼時(shí),必須先從列表中彈出P侠鳄。當(dāng)M結(jié)結(jié)束執(zhí)行Go代碼時(shí)埠啃，它將P塞回列表中。因此伟恶，當(dāng)M執(zhí)行Go代碼時(shí),它必須具有關(guān)聯(lián)的P碴开。這種機(jī)制渠道了sched.atomic(mcpu/mcpumax)

調(diào)度

??當(dāng)創(chuàng)建新的G或G變?yōu)榭蛇\(yùn)行時(shí)，它被塞到當(dāng)前P的可運(yùn)行goroutine列表博秫。當(dāng)P完成執(zhí)行G時(shí)潦牛，它首先嘗試從自己的可運(yùn)行goroutine列表中彈出G;如果列表為空，則P選擇一個(gè)隨機(jī)受害者(另一個(gè)P)并試圖從中竊取一半可運(yùn)行的goroutine挡育。

Syscalls/M 停止和非停止

??當(dāng)M創(chuàng)建一個(gè)新的G時(shí),它必須確保有另一個(gè)M來(lái)執(zhí)行G(如果不是所有的M都處于忙碌)巴碗。類似的，當(dāng)M進(jìn)入系統(tǒng)調(diào)用時(shí)静盅，它必須確保有另一個(gè)M來(lái)執(zhí)行Go代碼良价。
??有兩個(gè)選項(xiàng),我們可以迅速阻止和解鎖M,或采用一些旋轉(zhuǎn)。這是性能跟CPU不必要消耗之間的固有沖突蒿叠。我們的想法是使用旋轉(zhuǎn)并消耗CPU循環(huán)周期明垢。但是，它不應(yīng)該影響使用GOMAXPROCS = 1運(yùn)行的程序（命令行實(shí)用程序市咽，appengine等）痊银。

??旋轉(zhuǎn)分兩個(gè)級(jí)別:(1)一個(gè)關(guān)聯(lián)P的空閑M一直旋轉(zhuǎn)尋找新的G; (2)一個(gè)關(guān)聯(lián)P的w/o M旋轉(zhuǎn)等待可用的P;最多有GOMAXPROCS數(shù)量的旋轉(zhuǎn)M（包括（1）和（2））。當(dāng)存在類型（2）的空閑M時(shí)施绎，類型（1）的空閑M不會(huì)阻塞溯革。

??當(dāng)產(chǎn)生新的G，或者M(jìn)進(jìn)入系統(tǒng)調(diào)用谷醉，或者M(jìn)從空閑轉(zhuǎn)為忙時(shí)致稀，它確保至少有1個(gè)旋轉(zhuǎn)M（或者所有P都忙）。這確保了沒(méi)有可以運(yùn)行的可運(yùn)行的G;并避免同時(shí)過(guò)多的M阻塞/解除阻塞俱尼。

??旋轉(zhuǎn)主要是被動(dòng)的（屈服于OS抖单，sched_yield（）），但可能包括一點(diǎn)點(diǎn)主旋（循環(huán)切換CPU）（需要調(diào)查和調(diào)整）遇八。

終止/死鎖檢測(cè)

??終止/死鎖檢測(cè)在分布式系統(tǒng)中更存在問(wèn)題矛绘。一般的想法是僅在所有P都空閑時(shí)才進(jìn)行檢查（空閑P的全局的原子計(jì)數(shù)器）,這允做一些更昂貴代價(jià)的檢查比如涉及 prep狀態(tài)聚合的檢查。

系統(tǒng)線程鎖

??此功能不是性能關(guān)鍵刃永。

1. 鎖定G變?yōu)椴豢蛇\(yùn)行（Gwaiting）货矮。 M立即將P返回到空閑列表，喚醒另一個(gè)M并阻塞斯够。
1. 鎖定G變?yōu)榭蛇\(yùn)行（并到達(dá)runq的頭部）囚玫。當(dāng)前M移出自己的P并將G鎖定到與鎖定的G相關(guān)聯(lián)的M喧锦，并解鎖它。當(dāng)前的M變得空閑劫灶。

實(shí)施

目標(biāo)是將整個(gè)事物分成可以獨(dú)立審查和提交的最小部分裸违。

1.介紹P結(jié)構(gòu); 實(shí)現(xiàn)allp / idlep容器（idlep為啟動(dòng)器提供互斥保護(hù)）; 將P與M運(yùn)行Go代碼相關(guān)聯(lián)。全局互斥和原子狀態(tài)仍然存在本昏。
2.將G freelist移動(dòng)到P.
3.將mcache移動(dòng)到P.
4.將stackalloc移動(dòng)到P.
5.將ncgocall / gcstats移動(dòng)到P.
6.分散運(yùn)行隊(duì)列，實(shí)現(xiàn)工作竊取枪汪。消除G的不可接觸涌穆。這部分操作仍在全局互斥下。
7.刪除全局互斥鎖雀久，實(shí)現(xiàn)分布式終止檢測(cè)宿稀，LockOSThread。
8.實(shí)現(xiàn)旋轉(zhuǎn)而不是提示阻止/解除阻塞赖捌。

該計(jì)劃可能會(huì)失效祝沸，有很多未探索的細(xì)節(jié)。

潛在的進(jìn)一步改進(jìn)

1.嘗試LIFO調(diào)度越庇，局部上有所提升罩锐。但是，它仍然必須提供一定程度的公平性卤唉，并優(yōu)雅地處理屈服的goroutines涩惑。
2.在goroutine首次運(yùn)行之前，不要分配G和堆棧桑驱。對(duì)于新創(chuàng)建的goroutine竭恬，我們只需要callerpc，fn熬的，narg痊硕，nret和args，即大約6個(gè)單詞押框。這將允許創(chuàng)建大量運(yùn)行到完成的goroutine岔绸，顯著降低內(nèi)存開(kāi)銷。
4.更好的G-to-P局部性强戴。嘗試將未阻塞的G排入上一次運(yùn)行的P亭螟。
1. P-to-M的更好的局部性。嘗試在上次運(yùn)行的同一個(gè)M上執(zhí)行P.
6.限制M創(chuàng)建骑歹。調(diào)度程序可以很容易地強(qiáng)制每秒創(chuàng)建數(shù)千M预烙，直到OS拒絕創(chuàng)建更多線程。必須立即創(chuàng)建M道媚，直到k * GOMAXPROCS扁掸，之后可以通過(guò)計(jì)時(shí)器添加新的M.

其他

由于這項(xiàng)工作翘县，GOMAXPROCS不會(huì)消失。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末谴分，一起剝皮案震驚了整個(gè)濱河市锈麸，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌牺蹄，老刑警劉巖忘伞，帶你破解...
沈念sama閱讀 210,914評(píng)論 6贊 490
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異沙兰，居然都是意外死亡氓奈，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 89,935評(píng)論 2贊 383
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)鼎天，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)舀奶，“玉大人，你說(shuō)我怎么就攤上這事斋射∮祝” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 156,531評(píng)論 0贊 345
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵罗岖，是天一觀的道長(zhǎng)涧至。經(jīng)常有香客問(wèn)我，道長(zhǎng)呀闻，這世上最難降的妖魔是什么化借？我笑而不...
開(kāi)封第一講書(shū)人閱讀 56,309評(píng)論 1贊 282
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮捡多，結(jié)果婚禮上蓖康，老公的妹妹穿的比我還像新娘。我一直安慰自己垒手，他們只是感情好蒜焊，可當(dāng)我...
茶點(diǎn)故事閱讀 65,381評(píng)論 5贊 384
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著科贬，像睡著了一般泳梆。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上榜掌，一...
開(kāi)封第一講書(shū)人閱讀 49,730評(píng)論 1贊 289
城市分裂傳說(shuō)
那天优妙，我揣著相機(jī)與錄音，去河邊找鬼憎账。笑死套硼，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的胞皱。我是一名探鬼主播邪意，決...
沈念sama閱讀 38,882評(píng)論 3贊 404
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼九妈，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了雾鬼？” 一聲冷哼從身側(cè)響起萌朱，我...
開(kāi)封第一講書(shū)人閱讀 37,643評(píng)論 0贊 266
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎策菜，沒(méi)想到半個(gè)月后晶疼，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 44,095評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡又憨，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,448評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年冒晰，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片竟块。...
茶點(diǎn)故事閱讀 38,566評(píng)論 1贊 339
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖耐齐，靈堂內(nèi)的尸體忽然破棺而出浪秘，到底是詐尸還是另有隱情，我是刑警寧澤埠况，帶...
沈念sama閱讀 34,253評(píng)論 4贊 328
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布耸携，位于F島的核電站，受9級(jí)特大地震影響辕翰，放射性物質(zhì)發(fā)生泄漏夺衍。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,829評(píng)論 3贊 312
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一喜命、第九天我趴在偏房一處隱蔽的房頂上張望沟沙。院中可真熱鬧，春花似錦壁榕、人聲如沸矛紫。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,715評(píng)論 0贊 21
一樁弒父案牌里，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)颊咬。三九已至，卻和暖如春牡辽，著一層夾襖步出監(jiān)牢的瞬間喳篇，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 31,945評(píng)論 1贊 264
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工态辛，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留麸澜，地道東北人。一個(gè)月前我還...
沈念sama閱讀 46,248評(píng)論 2贊 360
代替公主和親
正文我出身青樓因妙，卻偏偏與公主長(zhǎng)得像痰憎，于是被迫代替她去往敵國(guó)和親票髓。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,440評(píng)論 2贊 348

為什么Go1.1從G-M模型轉(zhuǎn)變成G-M-P模型？