另外舱污,自己在看這篇文章時想幻,還看到了幾篇不錯的文章粱栖,在這里貼出來,希望對大家有所幫助脏毯,同時感謝這些技術(shù)大佬的分享闹究!
(1)?https://thoughts-on-java.org/review-java-performance-definitive/
(2)?http://blog.51cto.com/lavasoft/27069
(3)?https://tech.meituan.com/jvm_optimize.html
原文出處:?美團(tuán)技術(shù)團(tuán)隊(duì)
本文轉(zhuǎn)載自:http://www.open-open.com/lib/view/open1420814127390.html
引言
在一些物理內(nèi)存為8g的服務(wù)器上,主要運(yùn)行一個Java服務(wù)食店,系統(tǒng)內(nèi)存分配如下:Java服務(wù)的JVM堆大小設(shè)置為6g渣淤,一個監(jiān)控進(jìn)程占用大約 600m,Linux自身使用大約800m吉嫩。從表面上价认,物理內(nèi)存應(yīng)該是足夠使用的;但實(shí)際運(yùn)行的情況是自娩,會發(fā)生大量使用SWAP(說明物理內(nèi)存不夠使用 了)用踩,如下圖所示。同時,由于SWAP和GC同時發(fā)生會致使JVM嚴(yán)重卡頓脐彩,所以我們要追問:內(nèi)存究竟去哪兒了碎乃?
要分析這個問題,理解JVM和操作系統(tǒng)之間的內(nèi)存關(guān)系非常重要丁屎。接下來主要就Linux與JVM之間的內(nèi)存關(guān)系進(jìn)行一些分析荠锭。
一、Linux與進(jìn)程內(nèi)存模型
JVM以一個進(jìn)程(Process)的身份運(yùn)行在Linux系統(tǒng)上晨川,了解Linux與進(jìn)程的內(nèi)存關(guān)系证九,是理解JVM與Linux內(nèi)存的關(guān)系的基礎(chǔ)。
下圖給出了硬件共虑、系統(tǒng)愧怜、進(jìn)程三個層面的內(nèi)存之間的概要關(guān)系。
從硬件上看妈拌,Linux系統(tǒng)的內(nèi)存空間由兩個部分構(gòu)成:物理內(nèi)存和SWAP(位于磁盤)拥坛。物理內(nèi)存是Linux活動時使用的主要內(nèi)存區(qū)域;當(dāng)物理內(nèi) 存不夠使用時尘分,Linux會把一部分暫時不用的內(nèi)存數(shù)據(jù)放到磁盤上的SWAP中去猜惋,以便騰出更多的可用內(nèi)存空間;而當(dāng)需要使用位于SWAP的數(shù)據(jù)時培愁,必須 先將其換回到內(nèi)存中著摔。
從Linux系統(tǒng)上看,除了引導(dǎo)系統(tǒng)的BIN區(qū)定续,整個內(nèi)存空間主要被分成兩個部分:內(nèi)核內(nèi)存(Kernel space)谍咆、用戶內(nèi)存(User space)。
內(nèi)核內(nèi)存是Linux自身使用的內(nèi)存空間私股,主要提供給程序調(diào)度摹察、內(nèi)存分配、連接硬件資源等程序邏輯使用倡鲸。用戶內(nèi)存是提供給各個進(jìn)程主要空間供嚎,Linux給 各個進(jìn)程提供相同的虛擬內(nèi)存空間;這使得進(jìn)程之間相互獨(dú)立峭状,互不干擾克滴。實(shí)現(xiàn)的方法是采用虛擬內(nèi)存技術(shù):給每一個進(jìn)程一定虛擬內(nèi)存空間,而只有當(dāng)虛擬內(nèi)存實(shí) 際被使用時宁炫,才分配物理內(nèi)存偿曙。如下圖所示氮凝,對于32的Linux系統(tǒng)來說羔巢,一般將0~3G的虛擬內(nèi)存空間分配做為用戶空間,將3~4G的虛擬內(nèi)存空間分配 為內(nèi)核空間;64位系統(tǒng)的劃分情況是類似的竿秆。
從進(jìn)程的角度來看启摄,進(jìn)程能直接訪問的用戶內(nèi)存(虛擬內(nèi)存空間)被劃分為5個部分:代碼區(qū)、數(shù)據(jù)區(qū)幽钢、堆區(qū)歉备、棧區(qū)、未使用區(qū)匪燕。代碼區(qū)中存放應(yīng)用程序的機(jī) 器代碼蕾羊,運(yùn)行過程中代碼不能被修改,具有只讀和固定大小的特點(diǎn)帽驯。數(shù)據(jù)區(qū)中存放了應(yīng)用程序中的全局?jǐn)?shù)據(jù)龟再,靜態(tài)數(shù)據(jù)和一些常量字符串等,其大小也是固定的尼变。堆 是運(yùn)行時程序動態(tài)申請的空間利凑,屬于程序運(yùn)行時直接申請、釋放的內(nèi)存資源嫌术。棧區(qū)用來存放函數(shù)的傳入?yún)?shù)哀澈、臨時變量,以及返回地址等數(shù)據(jù)度气。未使用區(qū)是分配新內(nèi) 存空間的預(yù)備區(qū)域割按。
二、進(jìn)程與JVM內(nèi)存模型
JVM本質(zhì)就是一個進(jìn)程蚯嫌,因此其內(nèi)存模型也有進(jìn)程的一般特點(diǎn)哲虾。但是,JVM又不是一個普通的進(jìn)程择示,其在內(nèi)存模型上有許多嶄新的特點(diǎn)束凑,主要原因有兩 個:1.JVM將許多本來屬于操作系統(tǒng)管理范疇的東西,移植到了JVM內(nèi)部栅盲,目的在于減少系統(tǒng)調(diào)用的次數(shù)汪诉;2. Java NIO,目的在于減少用于讀寫IO的系統(tǒng)調(diào)用的開銷谈秫。 JVM進(jìn)程與普通進(jìn)程內(nèi)存模型比較如下圖:
需要說明的是扒寄,這個模型的并不是JVM內(nèi)存使用的精確模型,更側(cè)重于從操作系統(tǒng)的角度而省略了一些JVM的內(nèi)部細(xì)節(jié)(盡管也很重要)拟烫。下面從用戶內(nèi)存和內(nèi)核內(nèi)存兩個方面講解JVM進(jìn)程的內(nèi)存特點(diǎn)该编。
1.用戶內(nèi)存
上圖特別強(qiáng)調(diào)了JVM進(jìn)程模型的代碼區(qū)和數(shù)據(jù)區(qū)指的是JVM自身的,而非Java程序的硕淑。普通進(jìn)程棧區(qū)课竣,在JVM一般僅僅用做線程棧嘉赎。JVM的堆區(qū)和普通進(jìn)程的差別是最大的,下面具體詳細(xì)說明:
首先是永久代于樟。永久代本質(zhì)上是Java程序的代碼區(qū)和數(shù)據(jù)區(qū)公条。Java程序中類(class),會被加載到整個區(qū)域的不同數(shù)據(jù)結(jié)構(gòu)中去迂曲,包括常量 池靶橱、域、方法數(shù)據(jù)路捧、方法體关霸、構(gòu)造函數(shù)、以及類中的專用方法杰扫、實(shí)例初始化谒拴、接口初始化等。這個區(qū)域?qū)τ诓僮飨到y(tǒng)來說涉波,是堆的一個部分英上;而對于Java程序來 說,這是容納程序本身及靜態(tài)資源的空間啤覆,使得JVM能夠解釋執(zhí)行Java程序苍日。
其次是新生代和老年代。新生代和老年代才是Java程序真正使用的堆空間窗声,主要用于內(nèi)存對象的存儲相恃;但是其管理方式和普通進(jìn)程有本質(zhì)的區(qū)別。
普通進(jìn)程在運(yùn)行時給內(nèi)存對象分配空間時笨觅,比如C++執(zhí)行new操作時拦耐,會觸發(fā)一次分配內(nèi)存空間的系統(tǒng)調(diào)用,由操作系統(tǒng)的線程根據(jù)對象的大小分配好空間后返 回见剩;同時杀糯,程序釋放對象時,比如C++執(zhí)行delete操作時苍苞,也會觸發(fā)一次系統(tǒng)調(diào)用固翰,通知操作系統(tǒng)對象所占用的空間已經(jīng)可以回收。
JVM對內(nèi)存的使用和一般進(jìn)程不同羹呵。JVM向操作系統(tǒng)申請一整段內(nèi)存區(qū)域(具體大小可以在JVM參數(shù)調(diào)節(jié))作為Java程序的堆(分為新生代和老年代)骂际; 當(dāng)Java程序申請內(nèi)存空間,比如執(zhí)行new操作冈欢,JVM將在這段空間中按所需大小分配給Java程序歉铝,并且Java程序不負(fù)責(zé)通知JVM何時可以釋放這 個對象的空間,垃圾對象內(nèi)存空間的回收由JVM進(jìn)行凑耻。
JVM的內(nèi)存管理方式的優(yōu)點(diǎn)是顯而易見的太示,包括:第一送火,減少系統(tǒng)調(diào)用的次數(shù),JVM在給Java程序分配內(nèi)存空間時不需要操作系統(tǒng)干預(yù)先匪,僅僅在 Java堆大小變化時需要向操作系統(tǒng)申請內(nèi)存或通知回收,而普通程序每次內(nèi)存空間的分配回收都需要系統(tǒng)調(diào)用參與弃衍;第二呀非,減少內(nèi)存泄漏,普通程序沒有(或者 沒有及時)通知操作系統(tǒng)內(nèi)存空間的釋放是內(nèi)存泄漏的重要原因之一镜盯,而由JVM統(tǒng)一管理岸裙,可以避免程序員帶來的內(nèi)存泄漏問題。
最后是未使用區(qū)速缆,未使用區(qū)是分配新內(nèi)存空間的預(yù)備區(qū)域降允。對于普通進(jìn)程來說,這個區(qū)域被可用于堆和椧彰樱空間的申請及釋放剧董,每次堆內(nèi)存分配都會使用這個區(qū) 域,因此大小變動頻繁破停;對于JVM進(jìn)程來說翅楼,調(diào)整堆大小及線程棧時會使用該區(qū)域,而堆大小一般較少調(diào)整真慢,因此大小相對穩(wěn)定毅臊。操作系統(tǒng)會動態(tài)調(diào)整這個區(qū)域的 大小,并且這個區(qū)域通常并沒有被分配實(shí)際的物理內(nèi)存黑界,只是允許進(jìn)程在這個區(qū)域申請堆或椆苕遥空間。
2.內(nèi)核內(nèi)存
應(yīng)用程序通常不直接和內(nèi)核內(nèi)存打交道朗鸠,內(nèi)核內(nèi)存由操作系統(tǒng)進(jìn)行管理和使用蚯撩;不過隨著Linux對性能的關(guān)注及改進(jìn),一些新的特性使得應(yīng)用程序可以使 用內(nèi)核內(nèi)存烛占,或者是映射到內(nèi)核空間求厕。Java NIO正是在這種背景下誕生的,其充分利用了Linux系統(tǒng)的新特性扰楼,提升了Java程序的IO性能呀癣。
上圖給出了Java NIO使用的內(nèi)核內(nèi)存在linux系統(tǒng)中的分布情況。nio buffer主要包括:nio使用各種channel時所使用的ByteBuffer弦赖、Java程序主動使用 ByteBuffer.allocateDirector申請分配的Buffer项栏。而在PageCache里面,nio使用的內(nèi)存主要包 括:FileChannel.map方式打開文件占用mapped蹬竖、FileChannel.transferTo和 FileChannel.transferFrom所需要的Cache(圖中標(biāo)示 nio file)沼沈。
通過JMX可以監(jiān)控到NIO Buffer和 mapped 的使用情況流酬,如下圖所示。不過列另,F(xiàn)ileChannel的實(shí)現(xiàn)是通過系統(tǒng)調(diào)用使用原生的PageCache芽腾,過程對于Java是透明的,無法監(jiān)控到這部分內(nèi)存的使用大小页衙。
Linux和Java NIO在內(nèi)核內(nèi)存上開辟空間給程序使用摊滔,主要是減少不要的復(fù)制,以減少IO操作系統(tǒng)調(diào)用的開銷店乐。例如艰躺,將磁盤文件的數(shù)據(jù)發(fā)送網(wǎng)卡,使用普通方法和NIO時眨八,數(shù)據(jù)流動比較下圖所示:
將數(shù)據(jù)在內(nèi)核內(nèi)存和用戶內(nèi)存之間拷貝是比較消耗資源和時間的事情腺兴,而從上圖我們可以看到,通過NIO的方式減少了2次內(nèi)核內(nèi)存和用戶內(nèi)存之間的數(shù)據(jù)拷貝廉侧。這是Java NIO高性能的重要機(jī)制之一(另一個是異步非阻塞)页响。
從上面可以看出,內(nèi)核內(nèi)存對于Java程序性能也非常重要段誊,因此拘泞,在劃分系統(tǒng)內(nèi)存使用時候,一定要給內(nèi)核留出一定可用空間枕扫。
三陪腌、案例分析
1.內(nèi)存分配問題
通過上面的分析,省略比較小的區(qū)域烟瞧,可以總結(jié)JVM占用的內(nèi)存:
JVM內(nèi)存 ≈ Java永久代 + Java堆(新生代和老年代) + 線程棧+ Java NIO
回到文章開頭提出的問題诗鸭,原來的內(nèi)存分配是:6g(java堆) + 600m(監(jiān)控) + 800m(系統(tǒng)),剩余大約600m內(nèi)存未分配参滴。
現(xiàn)在分析這600m內(nèi)存的分配情況:
(1)Linux保留大約200m强岸,這部分是Linux正常運(yùn)行的需要,
(2)Java服務(wù)的線程數(shù)量是160個砾赔,JVM默認(rèn)的線程棧大小是1m蝌箍,因此使用160m內(nèi)存,
(3)Java NIO buffer暴心,通過JMX查到最多占用了200m妓盲,
(4)Java服務(wù)使用NIO大量讀寫文件,需要使用PageCache专普,正如前面分析悯衬,這個暫時不好定量估算大小。
前三項(xiàng)加起來已經(jīng)560m檀夹,因此可以斷定Linux物理內(nèi)存不夠使用筋粗。
細(xì)心的人會發(fā)現(xiàn)策橘,引言中給出兩個服務(wù)器,一個SWAP最多占用了2.16g娜亿,另外一個SWAP最多占用了871m丽已;但是,似乎我們的內(nèi)存缺口沒有那么大买决。事實(shí)上沛婴,這是由于SWAP和GC同時進(jìn)行造成的,從下圖可以看到策州,SWAP的使用和長時間的GC在同一時刻發(fā)生。
SWAP和GC同時發(fā)生會導(dǎo)致GC時間很長宫仗,JVM嚴(yán)重卡頓够挂,極端的情況下會導(dǎo)致服務(wù)崩潰。原因如下:JVM進(jìn)行GC時藕夫,時需要對相應(yīng)堆分區(qū)的已用 內(nèi)存進(jìn)行遍歷孽糖;假如GC的時候,有堆的一部分內(nèi)容被交換到SWAP中毅贮,遍歷到這部分的時候就需要將其交換回內(nèi)存办悟,同時由于內(nèi)存空間不足,就需要把內(nèi)存中堆 的另外一部分換到SWAP中去滩褥;于是在遍歷堆分區(qū)的過程中病蛉,(極端情況下)會把整個堆分區(qū)輪流往SWAP寫一遍。Linux對SWAP的回收是滯后的瑰煎,我 們就會看到大量SWAP占用铺然。
上述問題,可以通過減少堆大小酒甸,或者增加物理內(nèi)存解決魄健。
因此,我們得出一個結(jié)論:部署Java服務(wù)的Linux系統(tǒng)插勤,在內(nèi)存分配上沽瘦,需要避免SWAP的使用;具體如何分配需要綜合考慮不同場景下JVM對Java永久代 农尖、Java堆(新生代和老年代)析恋、線程棧、Java NIO所使用內(nèi)存的需求盛卡。
2.內(nèi)存泄漏問題
另一個案例是绿满,8g內(nèi)存的服務(wù)器,Linux使用800m窟扑,監(jiān)控進(jìn)程使用600m喇颁,堆大小設(shè)置4g;系統(tǒng)可用內(nèi)存有2.5g左右橘霎,但是也發(fā)生了大量的SWAP占用姐叁。
分析這個問題如下:
(1)在這個場景中, Java永久代 原环、Java堆(新生代和老年代)嘱吗、線程棧所用內(nèi)存基本是固定的谒麦,因此哆致,占用內(nèi)存過多的原因就定位在Java NIO上摊阀。
(2)根據(jù)前面的模型,Java NIO使用的內(nèi)存主要分布在Linux內(nèi)核內(nèi)存的System區(qū)和PageCache區(qū)城丧。查看監(jiān)控的記錄豌鹤,如下圖布疙,我們可以看到發(fā)生SWAP之前灵临,也就是 物理內(nèi)存不夠使用的時候儒溉,PageCache急劇縮小。因此波闹,可以定位在System區(qū)的Java NIO Buffer發(fā)生內(nèi)存泄漏精堕。
(3)由于NIO的DirectByteBuffer需要在GC的后期被回收瘫证,因此連續(xù)申請DirectByteBuffer的程序背捌,通常需要調(diào)用 System.gc()毡庆,避免長時間不發(fā)生FullGC導(dǎo)致引用在old區(qū)的DirectByteBuffer內(nèi)存泄漏巡扇。分析到此厅翔,可以推斷有兩種可能的 原因:第一刀闷,Java程序沒有在必要的時候調(diào)用System.gc()甸昏;第二徐许,System.gc()被禁用雌隅。
(4)最后是要排查JVM啟動參數(shù)和Java程序的DirectByteBuffer使用情況恰起。在本例中检盼,查看JVM啟動參數(shù),發(fā)現(xiàn)啟用了-XX:+DisableExplicitGC導(dǎo)致System.gc()被禁用蹦渣。
四剂桥、總結(jié)
本文詳細(xì)分析了Linux與JVM的內(nèi)存關(guān)系权逗,比較了一般進(jìn)程與JVM進(jìn)程使用內(nèi)存的異同點(diǎn)斟薇,理解這些特性將對Linux系統(tǒng)內(nèi)存分配、JVM調(diào)優(yōu)胯陋、Java程序優(yōu)化有幫助遏乔。限于篇幅關(guān)系僅僅列舉兩個案例盟萨,希望起到拋磚引玉的作用捻激。