vmstat是Virtual Meomory Statistics(虛擬內(nèi)存統(tǒng)計(jì))的縮寫,可對(duì)操作系統(tǒng)的虛擬內(nèi)存秕噪、進(jìn)程钳降、CPU活動(dòng)進(jìn)行監(jiān)控。
他是對(duì)系統(tǒng)的整體情況進(jìn)行統(tǒng)計(jì)腌巾,不足之處是無法對(duì)某個(gè)進(jìn)程進(jìn)行深入分析遂填。
vmstat 工具提供了一種低開銷的系統(tǒng)性能觀察方式。
因?yàn)?vmstat 本身就是低開銷工具澈蝙,在非常高負(fù)荷的服務(wù)器上城菊,你需要查看并監(jiān)控系統(tǒng)的健康情況,在控制窗口還是能夠使用vmstat 輸出結(jié)果。
在學(xué)習(xí)vmstat命令前碉克,我們先了解一下Linux系統(tǒng)中關(guān)于物理內(nèi)存和虛擬內(nèi)存相關(guān)信息凌唬。
物理內(nèi)存和虛擬內(nèi)存區(qū)別:
我們知道,直接從物理內(nèi)存讀寫數(shù)據(jù)要比從硬盤讀寫數(shù)據(jù)要快的多漏麦,因此客税,我們希望所有數(shù)據(jù)的讀取和寫入都在內(nèi)存完成,而內(nèi)存是有限的撕贞,這樣就引出了物理內(nèi)存與虛擬內(nèi)存的概念更耻。
物理內(nèi)存就是系統(tǒng)硬件提供的內(nèi)存大小,是真正的內(nèi)存捏膨,相對(duì)于物理內(nèi)存秧均,在linux下還有一個(gè)虛擬內(nèi)存的概念,虛擬內(nèi)存就是為了滿足物理內(nèi)存的不足而提出的策略号涯,它是利用磁盤空間虛擬出的一塊邏輯內(nèi)存目胡,用作虛擬內(nèi)存的磁盤空間被稱為交換空間(Swap Space)。
作為物理內(nèi)存的擴(kuò)展链快,linux會(huì)在物理內(nèi)存不足時(shí)誉己,使用交換分區(qū)的虛擬內(nèi)存,更詳細(xì)的說域蜗,就是內(nèi)核會(huì)將暫時(shí)不用的內(nèi)存塊信息寫到交換空間巨双,這樣以來,物理內(nèi)存得到了釋放霉祸,這塊內(nèi)存就可以用于其它目的筑累,當(dāng)需要用到原始的內(nèi)容時(shí),這些信息會(huì)被重新從交換空間讀入物理內(nèi)存丝蹭。
linux的內(nèi)存管理采取的是分頁存取機(jī)制慢宗,為了保證物理內(nèi)存能得到充分的利用,內(nèi)核會(huì)在適當(dāng)?shù)臅r(shí)候?qū)⑽锢韮?nèi)存中不經(jīng)常使用的數(shù)據(jù)塊自動(dòng)交換到虛擬內(nèi)存中,而將經(jīng)常使用的信息保留到物理內(nèi)存婆廊。
要深入了解linux內(nèi)存運(yùn)行機(jī)制,需要知道下面提到的幾個(gè)方面:
首先巫橄,Linux系統(tǒng)會(huì)不時(shí)的進(jìn)行頁面交換操作淘邻,以保持盡可能多的空閑物理內(nèi)存,即使并沒有什么事情需要內(nèi)存湘换,Linux也會(huì)交換出暫時(shí)不用的內(nèi)存頁面宾舅。這可以避免等待交換所需的時(shí)間。
其次彩倚,linux進(jìn)行頁面交換是有條件的筹我,不是所有頁面在不用時(shí)都交換到虛擬內(nèi)存,linux內(nèi)核根據(jù)”最近最經(jīng)常使用“算法帆离,僅僅將一些不經(jīng)常使用的頁面文件交換到虛擬內(nèi)存蔬蕊,有時(shí)我們會(huì)看到這么一個(gè)現(xiàn)象:linux物理內(nèi)存還有很多,但是交換空間也使用了很多哥谷。
其實(shí)岸夯,這并不奇怪,例如们妥,一個(gè)占用很大內(nèi)存的進(jìn)程運(yùn)行時(shí)猜扮,需要耗費(fèi)很多內(nèi)存資源,此時(shí)就會(huì)有一些不常用頁面文件被交換到虛擬內(nèi)存中监婶,但后來這個(gè)占用很多內(nèi)存資源的進(jìn)程結(jié)束并釋放了很多內(nèi)存時(shí)旅赢,剛才被交換出去的頁面文件并不會(huì)自動(dòng)的交換進(jìn)物理內(nèi)存,
除非有這個(gè)必要惑惶,那么此刻系統(tǒng)物理內(nèi)存就會(huì)空閑很多煮盼,同時(shí)交換空間也在被使用,就出現(xiàn)了剛才所說的現(xiàn)象了带污。
關(guān)于這點(diǎn)孕似,不用擔(dān)心什么,只要知道是怎么一回事就可以了刮刑。
最后喉祭,交換空間的頁面在使用時(shí)會(huì)首先被交換到物理內(nèi)存,如果此時(shí)沒有足夠的物理內(nèi)存來容納這些頁面雷绢,它們又會(huì)被馬上交換出去泛烙,如此以來,虛擬內(nèi)存中可能沒有足夠空間來存儲(chǔ)這些交換頁面翘紊,最終會(huì)導(dǎo)致linux出現(xiàn)假死機(jī)蔽氨、服務(wù)異常等問題,linux雖然可以在一段時(shí)間內(nèi)自行恢復(fù),但是恢復(fù)后的系統(tǒng)已經(jīng)基本不可用了鹉究。
因此宇立,合理規(guī)劃和設(shè)計(jì)linux內(nèi)存的使用,是非常重要的自赔。
虛擬內(nèi)存原理:
在系統(tǒng)中運(yùn)行的每個(gè)進(jìn)程都需要使用到內(nèi)存妈嘹,但不是每個(gè)進(jìn)程都需要每時(shí)每刻使用系統(tǒng)分配的內(nèi)存空間。當(dāng)系統(tǒng)運(yùn)行所需內(nèi)存超過實(shí)際的物理內(nèi)存绍妨,內(nèi)核會(huì)釋放某些進(jìn)程所占用但未使用的部分或所有物理內(nèi)存润脸,將這部分資料存儲(chǔ)在磁盤上直到進(jìn)程下一次調(diào)用,并將釋放出的內(nèi)存提供給有需要的進(jìn)程使用他去。
在Linux內(nèi)存管理中毙驯,主要是通過“調(diào)頁P(yáng)aging”和“交換Swapping”來完成上述的內(nèi)存調(diào)度。調(diào)頁算法是將內(nèi)存中最近不常使用的頁面換到磁盤上灾测,把活動(dòng)頁面保留在內(nèi)存中供進(jìn)程使用爆价。交換技術(shù)是將整個(gè)進(jìn)程,而不是部分頁面媳搪,全部交換到磁盤上允坚。
分頁(Page)寫入磁盤的過程被稱作Page-Out,分頁(Page)從磁盤重新回到內(nèi)存的過程被稱作Page-In蛾号。當(dāng)內(nèi)核需要一個(gè)分頁時(shí)稠项,但發(fā)現(xiàn)此分頁不在物理內(nèi)存中(因?yàn)橐呀?jīng)被Page-Out了),此時(shí)就發(fā)生了分頁錯(cuò)誤(Page Fault)鲜结。
當(dāng)系統(tǒng)內(nèi)核發(fā)現(xiàn)可運(yùn)行內(nèi)存變少時(shí)展运,就會(huì)通過Page-Out來釋放一部分物理內(nèi)存。經(jīng)管Page-Out不是經(jīng)常發(fā)生精刷,但是如果Page-out頻繁不斷的發(fā)生拗胜,直到當(dāng)內(nèi)核管理分頁的時(shí)間超過運(yùn)行程式的時(shí)間時(shí),系統(tǒng)效能會(huì)急劇下降怒允。這時(shí)的系統(tǒng)已經(jīng)運(yùn)行非常慢或進(jìn)入暫停狀態(tài)埂软,這種狀態(tài)亦被稱作thrashing(顛簸)。
1.命令格式:
vmstat [-a] [-n] [-S unit] [delay [ count]]
vmstat [-s] [-n] [-S unit]
vmstat [-m] [-n] [delay [ count]]
vmstat [-d] [-n] [delay [ count]]
vmstat [-p disk partition] [-n] [delay [ count]]
vmstat [-f]
vmstat [-V]
2.命令功能:
用來顯示虛擬內(nèi)存的信息
3.命令參數(shù):
-a:顯示活躍和非活躍內(nèi)存
-f:顯示從系統(tǒng)啟動(dòng)至今的fork數(shù)量 纫事。
-m:顯示slabinfo
-n:只在開始時(shí)顯示一次各字段名稱勘畔。
-s:顯示內(nèi)存相關(guān)統(tǒng)計(jì)信息及多種系統(tǒng)活動(dòng)數(shù)量。
delay:刷新時(shí)間間隔丽惶。如果不指定炫七,只顯示一條結(jié)果。
count:刷新次數(shù)钾唬。如果不指定刷新次數(shù)万哪,但指定了刷新時(shí)間間隔侠驯,這時(shí)刷新次數(shù)為無窮。
-d:顯示磁盤相關(guān)統(tǒng)計(jì)信息奕巍。
-p:顯示指定磁盤分區(qū)統(tǒng)計(jì)信息
-S:使用指定單位顯示吟策。參數(shù)有 k 、K 的止、m 檩坚、M ,分別代表1000冲杀、1024效床、1000000睹酌、1048576字節(jié)(byte)权谁。默認(rèn)單位為K(1024 bytes)
-V:顯示vmstat版本信息。
4.使用實(shí)例:
實(shí)例1:顯示虛擬內(nèi)存使用情況
命令:
vmstat
輸出:
[root@localhost ~]# vmstat 5 6
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------
r b swpd free buff cache si so bi bo in cs us sy id wa st
0 0 0 3029876 199616 690980 0 0 0 2 3 2 0 0 100 0 0
0 0 0 3029752 199616 690980 0 0 0 41 1009 39 0 0 100 0 0
0 0 0 3029752 199616 690980 0 0 0 3 1004 36 0 0 100 0 0
0 0 0 3029752 199616 690980 0 0 0 4 1004 36 0 0 100 0 0
0 0 0 3029752 199616 690980 0 0 0 6 1003 33 0 0 100 0 0
0 0 0 3029752 199616 690980 0 0 0 5 1003 33 0 0 100 0 0
說明:
字段說明:
Procs(進(jìn)程):
r: 運(yùn)行隊(duì)列中進(jìn)程數(shù)量
b: 等待IO的進(jìn)程數(shù)量
Memory(內(nèi)存):
swpd: 使用虛擬內(nèi)存大小
free: 可用內(nèi)存大小
buff: 用作緩沖的內(nèi)存大小
cache: 用作緩存的內(nèi)存大小
Swap:
si: 每秒從交換區(qū)寫到內(nèi)存的大小
so: 每秒寫入交換區(qū)的內(nèi)存大小
IO:(現(xiàn)在的Linux版本塊的大小為1024bytes)
bi: 每秒讀取的塊數(shù)
bo: 每秒寫入的塊數(shù)
系統(tǒng):
in: 每秒中斷數(shù)憋沿,包括時(shí)鐘中斷旺芽。
cs: 每秒上下文切換數(shù)。
CPU(以百分比表示):
us: 用戶進(jìn)程執(zhí)行時(shí)間(user time)
sy: 系統(tǒng)進(jìn)程執(zhí)行時(shí)間(system time)
id: 空閑時(shí)間(包括IO等待時(shí)間),中央處理器的空閑時(shí)間 辐啄。以百分比表示采章。
wa: 等待IO時(shí)間
備注: 如果 r經(jīng)常大于 4 ,且id經(jīng)常少于40壶辜,表示cpu的負(fù)荷很重悯舟。
如果pi,po 長期不等于0砸民,表示內(nèi)存不足抵怎。如果disk 經(jīng)常不等于0, 且在 b中的隊(duì)列 大于3岭参, 表示 io性能不好反惕。
Linux在具有高穩(wěn)定性、可靠性的同時(shí)演侯,具有很好的可伸縮性和擴(kuò)展性姿染,能夠針對(duì)不同的應(yīng)用和硬件環(huán)境調(diào)整,優(yōu)化出滿足當(dāng)前應(yīng)用需要的最佳性能秒际。
因此企業(yè)在維護(hù)Linux系統(tǒng)悬赏、進(jìn)行系統(tǒng)調(diào)優(yōu)時(shí),了解系統(tǒng)性能分析工具是至關(guān)重要的娄徊。
命令:
vmstat 5 5
表示在5秒時(shí)間內(nèi)進(jìn)行5次采樣舷嗡。將得到一個(gè)數(shù)據(jù)匯總他能夠反映真正的系統(tǒng)情況。
實(shí)例2:顯示活躍和非活躍內(nèi)存
命令:
vmstat -a 2 5
輸出:
[root@localhost ~]# vmstat -a 2 5
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------
r b swpd free inact active si so bi bo in cs us sy id wa st
0 0 0 3029752 387728 513008 0 0 0 2 3 2 0 0 100 0 0
0 0 0 3029752 387728 513076 0 0 0 0 1005 34 0 0 100 0 0
0 0 0 3029752 387728 513076 0 0 0 22 1004 36 0 0 100 0 0
0 0 0 3029752 387728 513076 0 0 0 0 1004 33 0 0 100 0 0
0 0 0 3029752 387728 513076 0 0 0 0 1003 32 0 0 100 0 0
[root@localhost ~]#
說明:
使用-a選項(xiàng)顯示活躍和非活躍內(nèi)存時(shí)嵌莉,所顯示的內(nèi)容除增加inact和active外进萄,其他顯示內(nèi)容與例子1相同。
字段說明:
Memory(內(nèi)存):
inact: 非活躍內(nèi)存大小(當(dāng)使用-a選項(xiàng)時(shí)顯示)
active: 活躍的內(nèi)存大兄惺蟆(當(dāng)使用-a選項(xiàng)時(shí)顯示)
實(shí)例3:查看系統(tǒng)已經(jīng)fork了多少次
命令:
vmstat -f
輸出:
[root@SCF1129 ~]# vmstat -f
12744849 forks
[root@SCF1129 ~]#
說明:
這個(gè)數(shù)據(jù)是從/proc/stat中的processes字段里取得的
實(shí)例4:查看內(nèi)存使用的詳細(xì)信息
命令:
vmstat -s
輸出:
[root@localhost ~]# vmstat -s
4043760 total memory
1013884 used memory
513012 active memory
387728 inactive memory
3029876 free memory
199616 buffer memory
690980 swap cache
6096656 total swap
0 used swap
6096656 free swap
83587 non-nice user cpu ticks
132 nice user cpu ticks
278599 system cpu ticks
913344692 idle cpu ticks
814550 IO-wait cpu ticks
10547 IRQ cpu ticks
21261 softirq cpu ticks
0 stolen cpu ticks
310215 pages paged in
14254652 pages paged out
0 pages swapped in
0 pages swapped out
288374745 interrupts
146680577 CPU context switches
1351868832 boot time
367291 forks
說明:
這些信息的分別來自于/proc/meminfo,/proc/stat和/proc/vmstat可婶。
實(shí)例5:查看磁盤的讀/寫
命令:
vmstat -d
輸出:
說明:
這些信息主要來自于/proc/diskstats.
merged:表示一次來自于合并的寫/讀請(qǐng)求,一般系統(tǒng)會(huì)把多個(gè)連接/鄰近的讀/寫請(qǐng)求合并到一起來操作.
實(shí)例6:查看/dev/sda1磁盤的讀/寫
命令:
輸出:
[root@SCF1129 ~]# df
文件系統(tǒng) 1K-塊 已用 可用 已用% 掛載點(diǎn)
/dev/sda3 1119336548 27642068 1034835500 3% /tmpfs 32978376 0 32978376 0% /dev/shm
/dev/sda1 1032088 59604 920056 7% /boot
[root@SCF1129 ~]# vmstat -p /dev/sda1
sda1 reads read sectors writes requested writes
18607 4249978 6 48[root@SCF1129 ~]# vmstat -p /dev/sda3
sda3 reads read sectors writes requested writes
429350 35176268 28998789 980301488[root@SCF1129 ~]#
說明:
這些信息主要來自于/proc/diskstats。
reads:來自于這個(gè)分區(qū)的讀的次數(shù)援雇。
read sectors:來自于這個(gè)分區(qū)的讀扇區(qū)的次數(shù)矛渴。
writes:來自于這個(gè)分區(qū)的寫的次數(shù)。
requested writes:來自于這個(gè)分區(qū)的寫請(qǐng)求次數(shù)惫搏。
實(shí)例7:查看系統(tǒng)的slab信息
命令:
vmstat -m
輸出:
Cache Num Total Size Pages
fuse_request 0 0 280 14
fuse_inode 1 9 448 9
jbd2_1k 0 0 1024 4
kvm_vcpu 0 0 15104 1
pte_list_desc 0 0 16 240
ext4_inode_cache 13142 13150 688 5
ext4_prealloc_space 8 56 72 56
jbd2_journal_head 36 63 64 63
jbd2_revoke_table_s 4 240 16 240
jbd2_revoke_record_s 4046 6572 32 124
btrfs_prelim_ref 0 0 64 63
btrfs_delayed_extent_op 16 99 40 99
btrfs_delayed_data_ref 0 0 88 46
btrfs_delayed_ref_head 0 0 136 30
btrfs_delayed_node 0 0 248 16
btrfs_ordered_extent 0 0 240 17
btrfs_extent_map 0 0 120 33
btrfs_extent_buffer 0 0 176 23
btrfs_delalloc_work 0 0 80 50
btrfs_free_space 0 0 48 83
btrfs_path 441 468 112
這組信息來自于/proc/slabinfo具温。
slab:由于內(nèi)核會(huì)有許多小對(duì)象,這些對(duì)象構(gòu)造銷毀十分頻繁筐赔,比如i-node铣猩,dentry,這些對(duì)象如果每次構(gòu)建的時(shí)候就向內(nèi)存要一個(gè)頁(4kb)茴丰,而其實(shí)只有幾個(gè)字節(jié)达皿,這樣就會(huì)非常浪費(fèi),
為了解決這個(gè)問題贿肩,就引入了一種新的機(jī)制來處理在同一個(gè)頁框中如何分配小存儲(chǔ)區(qū)峦椰,而slab可以對(duì)小對(duì)象進(jìn)行分配,這樣就不用為每一個(gè)對(duì)象分配頁框,從而節(jié)省了空間汰规,內(nèi)核對(duì)一些小對(duì)象創(chuàng)建析構(gòu)很頻繁汤功,
slab對(duì)這些小對(duì)象進(jìn)行緩沖,可以重復(fù)利用,減少內(nèi)存分配次數(shù)。