問(wèn)題描述
編程語(yǔ)言書(shū)籍中經(jīng)常解釋值類型被創(chuàng)建在棧上畏吓,引用類型被創(chuàng)建在堆上墨状,但是并沒(méi)有本質(zhì)上解釋這堆和棧是什么。我僅有高級(jí)語(yǔ)言編程經(jīng)驗(yàn)菲饼,沒(méi)有看過(guò)對(duì)此更清晰的解釋肾砂。我的意思是我理解什么是棧,但是它們到底是什么宏悦,在哪兒呢(站在實(shí)際的計(jì)算機(jī)物理內(nèi)存的角度上看)镐确?
在通常情況下由操作系統(tǒng)(OS)和語(yǔ)言的運(yùn)行時(shí)(runtime)控制嗎?
它們的作用范圍是什么饼煞?
它們的大小由什么決定源葫?
哪個(gè)更快?
答案一
棧是為執(zhí)行線程留出的內(nèi)存空間砖瞧。當(dāng)函數(shù)被調(diào)用的時(shí)候息堂,棧頂為局部變量和一些 bookkeeping 數(shù)據(jù)預(yù)留塊。當(dāng)函數(shù)執(zhí)行完畢块促,塊就沒(méi)有用了荣堰,可能在下次的函數(shù)調(diào)用的時(shí)候再被使用。棧通常用后進(jìn)先出(LIFO)的方式預(yù)留空間竭翠;因此最近的保留塊(reserved block)通常最先被釋放振坚。這么做可以使跟蹤堆棧變的簡(jiǎn)單;從棧中釋放塊(free block)只不過(guò)是指針的偏移而已斋扰。
堆(heap)是為動(dòng)態(tài)分配預(yù)留的內(nèi)存空間渡八。和棧不一樣,從堆上分配和重新分配塊沒(méi)有固定模式褥实;你可以在任何時(shí)候分配和釋放它呀狼。這樣使得跟蹤哪部分堆已經(jīng)被分配和被釋放變的異常復(fù)雜;有許多定制的堆分配策略用來(lái)為不同的使用模式下調(diào)整堆的性能损离。
每一個(gè)線程都有一個(gè)棧哥艇,但是每一個(gè)應(yīng)用程序通常都只有一個(gè)堆(盡管為不同類型分配內(nèi)存使用多個(gè)堆的情況也是有的)。
直接回答你的問(wèn)題: 1. 當(dāng)線程創(chuàng)建的時(shí)候僻澎,操作系統(tǒng)(OS)為每一個(gè)系統(tǒng)級(jí)(system-level)的線程分配棧貌踏。通常情況下十饥,操作系統(tǒng)通過(guò)調(diào)用語(yǔ)言的運(yùn)行時(shí)(runtime)去為應(yīng)用程序分配堆。 2. 棧附屬于線程祖乳,因此當(dāng)線程結(jié)束時(shí)棧被回收逗堵。堆通常通過(guò)運(yùn)行時(shí)在應(yīng)用程序啟動(dòng)時(shí)被分配,當(dāng)應(yīng)用程序(進(jìn)程)退出時(shí)被回收眷昆。 3. 當(dāng)線程被創(chuàng)建的時(shí)候蜒秤,設(shè)置棧的大小。在應(yīng)用程序啟動(dòng)的時(shí)候亚斋,設(shè)置堆的大小作媚,但是可以在需要的時(shí)候擴(kuò)展(分配器向操作系統(tǒng)申請(qǐng)更多的內(nèi)存)。 4. 棧比堆要快帅刊,因?yàn)樗嫒∧J绞顾梢暂p松的分配和重新分配內(nèi)存(指針/整型只是進(jìn)行簡(jiǎn)單的遞增或者遞減運(yùn)算)纸泡,然而堆在分配和釋放的時(shí)候有更多的復(fù)雜的 bookkeeping 參與。另外赖瞒,在棧上的每個(gè)字節(jié)頻繁的被復(fù)用也就意味著它可能映射到處理器緩存中女揭,所以很快(譯者注:局部性原理)。
答案二
Stack:
和堆一樣存儲(chǔ)在計(jì)算機(jī) RAM 中栏饮。
在棧上創(chuàng)建變量的時(shí)候會(huì)擴(kuò)展吧兔,并且會(huì)自動(dòng)回收。
相比堆而言在棧上分配要快的多抡爹。
用數(shù)據(jù)結(jié)構(gòu)中的棧實(shí)現(xiàn)掩驱。
存儲(chǔ)局部數(shù)據(jù)芒划,返回地址冬竟,用做參數(shù)傳遞。
當(dāng)用棧過(guò)多時(shí)可導(dǎo)致棧溢出(無(wú)窮次(大量的)的遞歸調(diào)用民逼,或者大量的內(nèi)存分配)泵殴。
在棧上的數(shù)據(jù)可以直接訪問(wèn)(不是非要使用指針訪問(wèn))。
如果你在編譯之前精確的知道你需要分配數(shù)據(jù)的大小并且不是太大的時(shí)候拼苍,可以使用棧笑诅。
當(dāng)你程序啟動(dòng)時(shí)決定棧的容量上限。
Heap:
和棧一樣存儲(chǔ)在計(jì)算機(jī)RAM疮鲫。
在堆上的變量必須要手動(dòng)釋放吆你,不存在作用域的問(wèn)題。數(shù)據(jù)可用 delete, delete[] 或者 free 來(lái)釋放俊犯。
相比在棧上分配內(nèi)存要慢妇多。
通過(guò)程序按需分配。
大量的分配和釋放可造成內(nèi)存碎片燕侠。
在 C++ 中者祖,在堆上創(chuàng)建數(shù)的據(jù)使用指針訪問(wèn)立莉,用 new 或者 malloc 分配內(nèi)存。
如果申請(qǐng)的緩沖區(qū)過(guò)大的話七问,可能申請(qǐng)失敗蜓耻。
在運(yùn)行期間你不知道會(huì)需要多大的數(shù)據(jù)或者你需要分配大量的內(nèi)存的時(shí)候,建議你使用堆械巡。
可能造成內(nèi)存泄露刹淌。
舉例:
C++
int foo()
{
char *pBuffer; //<--nothing allocated yet (excluding the pointer itself, which is allocated here on the stack).
bool b = true; // Allocated on the stack.
if(b)
{
//Create 500 bytes on the stack
char buffer[500];
//Create 500 bytes on the heap
pBuffer = new char[500];
}//<-- buffer is deallocated here, pBuffer is not
}//<--- oops there's a memory leak, I should have called delete[] pBuffer;
答案三
堆和棧是兩種內(nèi)存分配的兩個(gè)統(tǒng)稱〖ズ模可能有很多種不同的實(shí)現(xiàn)方式芦鳍,但是實(shí)現(xiàn)要符合幾個(gè)基本的概念:
1.對(duì)棧而言,棧中的新加數(shù)據(jù)項(xiàng)放在其他數(shù)據(jù)的頂部葛账,移除時(shí)你也只能移除最頂部的數(shù)據(jù)(不能越位獲饶啤)。
khqDF
2.對(duì)堆而言籍琳,數(shù)據(jù)項(xiàng)位置沒(méi)有固定的順序菲宴。你可以以任何順序插入和刪除,因?yàn)樗麄儧](méi)有“頂部”數(shù)據(jù)這一概念趋急。
E5QTV
上面上個(gè)圖片很好的描述了堆和棧分配內(nèi)存的方式喝峦。
在通常情況下由操作系統(tǒng)(OS)和語(yǔ)言的運(yùn)行時(shí)(runtime)控制嗎?
如前所述呜达,堆和棧是一個(gè)統(tǒng)稱谣蠢,可以有很多的實(shí)現(xiàn)方式。計(jì)算機(jī)程序通常有一個(gè)棧叫做調(diào)用棧查近,用來(lái)存儲(chǔ)當(dāng)前函數(shù)調(diào)用相關(guān)的信息(比如:主調(diào)函數(shù)的地址眉踱,局部變量),因?yàn)楹瘮?shù)調(diào)用之后需要返回給主調(diào)函數(shù)霜威。棧通過(guò)擴(kuò)展和收縮來(lái)承載信息谈喳。實(shí)際上,程序不是由運(yùn)行時(shí)來(lái)控制的戈泼,它由編程語(yǔ)言婿禽、操作系統(tǒng)甚至是系統(tǒng)架構(gòu)來(lái)決定。
堆是在任何內(nèi)存中動(dòng)態(tài)和隨機(jī)分配的(內(nèi)存的)統(tǒng)稱大猛;也就是無(wú)序的扭倾。內(nèi)存通常由操作系統(tǒng)分配,通過(guò)應(yīng)用程序調(diào)用 API 接口去實(shí)現(xiàn)分配挽绩。在管理動(dòng)態(tài)分配內(nèi)存上會(huì)有一些額外的開(kāi)銷膛壹,不過(guò)這由操作系統(tǒng)來(lái)處理。
它們的作用范圍是什么琼牧?
調(diào)用棧是一個(gè)低層次的概念恢筝,就程序而言哀卫,它和“作用范圍”沒(méi)什么關(guān)系。如果你反匯編一些代碼撬槽,你就會(huì)看到指針引用堆棧部分此改。就高級(jí)語(yǔ)言而言,語(yǔ)言有它自己的范圍規(guī)則侄柔。一旦函數(shù)返回共啃,函數(shù)中的局部變量會(huì)直接直接釋放。你的編程語(yǔ)言就是依據(jù)這個(gè)工作的暂题。
在堆中移剪,也很難去定義。作用范圍是由操作系統(tǒng)限定的薪者,但是你的編程語(yǔ)言可能增加它自己的一些規(guī)則纵苛,去限定堆在應(yīng)用程序中的范圍。體系架構(gòu)和操作系統(tǒng)是使用虛擬地址的言津,然后由處理器翻譯到實(shí)際的物理地址中攻人,還有頁(yè)面錯(cuò)誤等等。它們記錄那個(gè)頁(yè)面屬于那個(gè)應(yīng)用程序悬槽。不過(guò)你不用關(guān)心這些怀吻,因?yàn)槟銉H僅在你的編程語(yǔ)言中分配和釋放內(nèi)存,和一些錯(cuò)誤檢查(出現(xiàn)分配失敗和釋放失敗的原因)初婆。
它們的大小由什么決定蓬坡?
依舊,依賴于語(yǔ)言磅叛,編譯器屑咳,操作系統(tǒng)和架構(gòu)。棧通常提前分配好了宪躯,因?yàn)闂1仨毷沁B續(xù)的內(nèi)存塊乔宿。語(yǔ)言的編譯器或者操作系統(tǒng)決定它的大小位迂。不要在棧上存儲(chǔ)大塊數(shù)據(jù)访雪,這樣可以保證有足夠的空間不會(huì)溢出,除非出現(xiàn)了無(wú)限遞歸的情況(額掂林,棧溢出了)或者其它不常見(jiàn)了編程決議臣缀。
堆是任何可以動(dòng)態(tài)分配的內(nèi)存的統(tǒng)稱。這要看你怎么看待它了泻帮,它的大小是變動(dòng)的精置。在現(xiàn)代處理器中和操作系統(tǒng)的工作方式是高度抽象的,因此你在正常情況下不需要擔(dān)心它實(shí)際的大小锣杂,除非你必須要使用你還沒(méi)有分配的內(nèi)存或者已經(jīng)釋放了的內(nèi)存脂倦。
哪個(gè)更快一些番宁?
棧更快因?yàn)樗械目臻e內(nèi)存都是連續(xù)的,因此不需要對(duì)空閑內(nèi)存塊通過(guò)列表來(lái)維護(hù)赖阻。只是一個(gè)簡(jiǎn)單的指向當(dāng)前棧頂?shù)闹羔樀骸>幾g器通常用一個(gè)專門(mén)的、快速的寄存器來(lái)實(shí)現(xiàn)火欧。更重要的一點(diǎn)事是棋电,隨后的棧上操作通常集中在一個(gè)內(nèi)存塊的附近,這樣的話有利于處理器的高速訪問(wèn)(譯者注:局部性原理)苇侵。
答案四
你問(wèn)題的答案是依賴于實(shí)現(xiàn)的赶盔,根據(jù)不同的編譯器和處理器架構(gòu)而不同。下面簡(jiǎn)單的解釋一下:
棧和堆都是用來(lái)從底層操作系統(tǒng)中獲取內(nèi)存的榆浓。
在多線程環(huán)境下每一個(gè)線程都可以有他自己完全的獨(dú)立的棧于未,但是他們共享堆。并行存取被堆控制而不是棧陡鹃。
堆:
堆包含一個(gè)鏈表來(lái)維護(hù)已用和空閑的內(nèi)存塊沉眶。在堆上新分配(用 new 或者 malloc)內(nèi)存是從空閑的內(nèi)存塊中找到一些滿足要求的合適塊。這個(gè)操作會(huì)更新堆中的塊鏈表杉适。這些元信息也存儲(chǔ)在堆上谎倔,經(jīng)常在每個(gè)塊的頭部一個(gè)很小區(qū)域。
堆的增加新快通常從地地址向高地址擴(kuò)展猿推。因此你可以認(rèn)為堆隨著內(nèi)存分配而不斷的增加大小片习。如果申請(qǐng)的內(nèi)存大小很小的話,通常從底層操作系統(tǒng)中得到比申請(qǐng)大小要多的內(nèi)存蹬叭。
申請(qǐng)和釋放許多小的塊可能會(huì)產(chǎn)生如下?tīng)顟B(tài):在已用塊之間存在很多小的空閑塊藕咏。進(jìn)而申請(qǐng)大塊內(nèi)存失敗,雖然空閑塊的總和足夠秽五,但是空閑的小塊是零散的孽查,不能滿足申請(qǐng)的大小,坦喘。這叫做“堆碎片”盲再。
當(dāng)旁邊有空閑塊的已用塊被釋放時(shí),新的空閑塊可能會(huì)與相鄰的空閑塊合并為一個(gè)大的空閑塊瓣铣,這樣可以有效的減少“堆碎片”的產(chǎn)生答朋。
0Obi0
棧:
棧經(jīng)常與 sp 寄存器(譯者注:”stack pointer”,了解匯編的朋友應(yīng)該都知道)一起工作棠笑,最初 sp 指向棧頂(棧的高地址)梦碗。
CPU 用 push 指令來(lái)將數(shù)據(jù)壓棧,用 pop 指令來(lái)彈棧。當(dāng)用 push 壓棧時(shí)洪规,sp 值減少(向低地址擴(kuò)展)印屁。當(dāng)用 pop 彈棧時(shí),sp 值增大斩例。存儲(chǔ)和獲取數(shù)據(jù)都是 CPU 寄存器的值库车。
當(dāng)函數(shù)被調(diào)用時(shí),CPU使用特定的指令把當(dāng)前的 IP (譯者注:“instruction pointer”樱拴,是一個(gè)寄存器柠衍,用來(lái)記錄 CPU 指令的位置)壓棧。即執(zhí)行代碼的地址晶乔。CPU 接下來(lái)將調(diào)用函數(shù)地址賦給 IP 珍坊,進(jìn)行調(diào)用。當(dāng)函數(shù)返回時(shí)正罢,舊的 IP 被彈棧阵漏,CPU 繼續(xù)去函數(shù)調(diào)用之前的代碼。
當(dāng)進(jìn)入函數(shù)時(shí)翻具,sp 向下擴(kuò)展履怯,擴(kuò)展到確保為函數(shù)的局部變量留足夠大小的空間。如果函數(shù)中有一個(gè) 32-bit 的局部變量會(huì)在棧中留夠四字節(jié)的空間裆泳。當(dāng)函數(shù)返回時(shí)叹洲,sp 通過(guò)返回原來(lái)的位置來(lái)釋放空間。
如果函數(shù)有參數(shù)的話工禾,在函數(shù)調(diào)用之前运提,會(huì)將參數(shù)壓棧。函數(shù)中的代碼通過(guò) sp 的當(dāng)前位置來(lái)定位參數(shù)并訪問(wèn)它們闻葵。
函數(shù)嵌套調(diào)用和使用魔法一樣民泵,每一次新調(diào)用的函數(shù)都會(huì)分配函數(shù)參數(shù),返回值地址槽畔、局部變量空間栈妆、嵌套調(diào)用的活動(dòng)記錄都要被壓入棧中。函數(shù)返回時(shí)厢钧,按照正確方式的撤銷鳞尔。
棧要受到內(nèi)存塊的限制,不斷的函數(shù)嵌套/為局部變量分配太多的空間坏快,可能會(huì)導(dǎo)致棧溢出铅檩。當(dāng)棧中的內(nèi)存區(qū)域都已經(jīng)被使用完之后繼續(xù)向下寫(xiě)(低地址),會(huì)觸發(fā)一個(gè) CPU 異常莽鸿。這個(gè)異常接下會(huì)通過(guò)語(yǔ)言的運(yùn)行時(shí)轉(zhuǎn)成各種類型的棧溢出異常。(譯者注:“不同語(yǔ)言的異常提示不同,因此通過(guò)語(yǔ)言運(yùn)行時(shí)來(lái)轉(zhuǎn)換”我想他表達(dá)的是這個(gè)含義)
9UshP
*函數(shù)的分配可以用堆來(lái)代替棧嗎祥得?
不可以的兔沃,函數(shù)的活動(dòng)記錄(即局部或者自動(dòng)變量)被分配在棧上, 這樣做不但存儲(chǔ)了這些變量级及,而且可以用來(lái)嵌套函數(shù)的追蹤乒疏。
堆的管理依賴于運(yùn)行時(shí)環(huán)境,C 使用 malloc 饮焦,C++ 使用 new 怕吴,但是很多語(yǔ)言有垃圾回收機(jī)制。
棧是更低層次的特性與處理器架構(gòu)緊密的結(jié)合到一起县踢。當(dāng)堆不夠時(shí)可以擴(kuò)展空間转绷,這不難做到,因?yàn)榭梢杂袔?kù)函數(shù)可以調(diào)用硼啤。但是议经,擴(kuò)展棧通常來(lái)說(shuō)是不可能的,因?yàn)樵跅R绯龅臅r(shí)候谴返,執(zhí)行線程就被操作系統(tǒng)關(guān)閉了煞肾,這已經(jīng)太晚了。
譯者注
關(guān)于堆棧的這個(gè)帖子嗓袱,對(duì)我來(lái)說(shuō)籍救,收獲非常多。我之前看過(guò)一些資料渠抹,自己寫(xiě)代碼的時(shí)候也常常思考钧忽。就這方面,也和祥子(我的大學(xué)舍友逼肯,現(xiàn)在北京郵電讀研耸黑,技術(shù)牛人)探討過(guò)多次了。但是終究是一個(gè)一個(gè)的知識(shí)點(diǎn)篮幢,這個(gè)帖子看完之后大刊,豁然開(kāi)朗,把知識(shí)點(diǎn)終于連接成了一個(gè)網(wǎng)三椿。這種感覺(jué)缺菌,經(jīng)歷過(guò)的一定懂得,期間的興奮不言而喻搜锰。
這個(gè)帖子跟帖者不少伴郁,我選了評(píng)分最高的四個(gè)。這四個(gè)之間也有一些是重復(fù)的觀點(diǎn)蛋叼。個(gè)人鐘愛(ài)第四個(gè)回答者焊傅,我看的時(shí)候剂陡,瞬間高潮了,有木有狐胎?不過(guò)需要一些匯編語(yǔ)言鸭栖、操作系統(tǒng)、計(jì)算機(jī)組成原理的的基礎(chǔ)握巢,知道那幾個(gè)寄存器是干什么的晕鹊,要知道計(jì)算機(jī)的流水線指令工作機(jī)制,保護(hù)/恢復(fù)現(xiàn)場(chǎng)等概念暴浦。三個(gè)回復(fù)者都涉及到了操作系統(tǒng)中虛擬內(nèi)存溅话;在比較速度的時(shí)候,大家一定要在腦中對(duì)“局部性原理”和計(jì)算機(jī)高速緩存有一個(gè)概念歌焦。
如果你把這篇文章看懂了飞几,我相信你收獲的不只是堆和棧,你會(huì)理解的更多同规!
興奮之余循狰,有幾點(diǎn)還是要強(qiáng)調(diào)的,翻譯沒(méi)有逐字逐詞翻譯券勺,大部分是通過(guò)我個(gè)人的知識(shí)積累和對(duì)回帖者的意圖揣測(cè)而來(lái)的绪钥。請(qǐng)大家不要咬文嚼字,逐個(gè)推敲关炼,我們的目的在于技術(shù)交流程腹,不是么?達(dá)到這一目的就夠了儒拂。
下面是一些不確定點(diǎn):
我沒(méi)有聽(tīng)過(guò) bookkeeping data 這種說(shuō)法寸潦,故沒(méi)有翻譯。從上下文理解來(lái)看社痛,可以想成是用來(lái)寄存器值见转?函數(shù)參數(shù)?返回地址蒜哀?如果有了解具體含義的朋友斩箫,煩請(qǐng)告知。
棧和堆棧是一回事撵儿,英文表達(dá)是 stack乘客,堆是 heap。
調(diào)用棧的概念淀歇,我是第一次聽(tīng)說(shuō)易核,不太熟悉。大家可以去查查資料研究一下浪默。
以上牡直,送給大家缀匕,本文結(jié)束。