vmstat命令是最常見的Linux/Unix監(jiān)控工具荷科,可以展現(xiàn)給定時(shí)間間隔的服務(wù)器的狀態(tài)值,包括服務(wù)器的CPU使用率佛致,內(nèi)存使用珠闰,虛擬內(nèi)存交換情況,IO讀寫情況。這個(gè)命令是我查看Linux/Unix最喜愛的命令染乌,一個(gè)是Linux/Unix都支持山孔,二是相比top,我可以看到整個(gè)機(jī)器的CPU,內(nèi)存,IO的使用情況慕匠,而不是單單看到各個(gè)進(jìn)程的CPU使用率和內(nèi)存使用率(使用場景不一樣)饱须。
一般vmstat工具的使用是通過兩個(gè)數(shù)字參數(shù)來完成的,第一個(gè)參數(shù)是采樣的時(shí)間間隔數(shù)台谊,單位是秒,第二個(gè)參數(shù)是采樣的次數(shù)譬挚,如:
實(shí)際上锅铅,在應(yīng)用過程中,我們會在一段時(shí)間內(nèi)一直監(jiān)控减宣,不想監(jiān)控直接結(jié)束vmstat就行了,例如:
這表示vmstat每2秒采集數(shù)據(jù)盐须,一直采集,直到我結(jié)束程序漆腌,這里采集了5次數(shù)據(jù)我就結(jié)束了程序贼邓。
好了阶冈,命令介紹完畢,現(xiàn)在開始實(shí)戰(zhàn)講解每個(gè)參數(shù)的意思
- 運(yùn)行隊(duì)列(就是說多少個(gè)進(jìn)程真的分配到CPU)塑径,我測試的服務(wù)器目前CPU比較空閑女坑,沒什么程序在跑,當(dāng)這個(gè)值超過了CPU數(shù)目统舀,就會出現(xiàn)CPU瓶頸了匆骗。這個(gè)也和top的負(fù)載有關(guān)系,一般負(fù)載超過了3就比較高誉简,超過了5就高碉就,超過了10就不正常了,服務(wù)器的狀態(tài)很危險(xiǎn)闷串。top的負(fù)載類似每秒的運(yùn)行隊(duì)列瓮钥。如果運(yùn)行隊(duì)列過大,表示你的CPU很繁忙烹吵,一般會造成CPU使用率很高骏庸。
- b 表示阻塞的進(jìn)程,這個(gè)不多說,進(jìn)程阻塞年叮,大家懂的具被。
- swpd 虛擬內(nèi)存已使用的大小,如果大于0只损,表示你的機(jī)器物理內(nèi)存不足了一姿,如果不是程序內(nèi)存泄露的原因,那么你該升級內(nèi)存了或者把耗內(nèi)存的任務(wù)遷移到其他機(jī)器跃惫。
- free 空閑的物理內(nèi)存的大小叮叹,我的機(jī)器內(nèi)存總共8G,剩余3415M爆存。
- buff Linux/Unix系統(tǒng)是用來存儲蛉顽,目錄里面有什么內(nèi)容,權(quán)限等的緩存先较,我本機(jī)大概占用300多M
- cache cache直接用來記憶我們打開的文件,給文件做緩沖携冤,我本機(jī)大概占用300多M(這里是Linux/Unix的聰明之處,把空閑的物理內(nèi)存的一部分拿來做文件和目錄的緩存闲勺,是為了提高 程序執(zhí)行的性能曾棕,當(dāng)程序使用內(nèi)存時(shí),buffer/cached會很快地被使用菜循。)
- si 每秒從磁盤讀入虛擬內(nèi)存的大小翘地,如果這個(gè)值大于0,表示物理內(nèi)存不夠用或者內(nèi)存泄露了,要查找耗內(nèi)存進(jìn)程解決掉衙耕。我的機(jī)器內(nèi)存充裕昧穿,一切正常。
- so 每秒虛擬內(nèi)存寫入磁盤的大小橙喘,如果這個(gè)值大于0时鸵,同上。
- bi 塊設(shè)備每秒接收的塊數(shù)量渴杆,這里的塊設(shè)備是指系統(tǒng)上所有的磁盤和其他塊設(shè)備寥枝,默認(rèn)塊大小是1024byte,我本機(jī)上沒什么IO操作磁奖,所以一直是0囊拜,但是我曾在處理拷貝大量數(shù)據(jù)(2-3T)的機(jī)器上看過可以達(dá)到140000/s,磁盤寫入速度差不多140M每秒
- bo 塊設(shè)備每秒發(fā)送的塊數(shù)量比搭,例如我們讀取文件冠跷,bo就要大于0。bi和bo一般都要接近0身诺,不然就是IO過于頻繁蜜托,需要調(diào)整。
- in 每秒CPU的中斷次數(shù)霉赡,包括時(shí)間中斷
- cs 每秒上下文切換次數(shù)橄务,例如我們調(diào)用系統(tǒng)函數(shù),就要進(jìn)行上下文切換穴亏,線程的切換蜂挪,也要進(jìn)程上下文切換,這個(gè)值要越小越好嗓化,太大了棠涮,要考慮調(diào)低線程或者進(jìn)程的數(shù)目,例如在apache和nginx這種web服務(wù)器中,我們一般做性能測試時(shí)會進(jìn)行幾千并發(fā)甚至幾萬并發(fā)的測試刺覆,選擇web服務(wù)器的進(jìn)程可以由進(jìn)程或者線程的峰值一直下調(diào)严肪,壓測,直到cs到一個(gè)比較小的值谦屑,這個(gè)進(jìn)程和線程數(shù)就是比較合適的值了驳糯。系統(tǒng)調(diào)用也是,每次調(diào)用系統(tǒng)函數(shù)伦仍,我們的代碼就會進(jìn)入內(nèi)核空間结窘,導(dǎo)致上下文切換,這個(gè)是很耗資源充蓝,也要盡量避免頻繁調(diào)用系統(tǒng)函數(shù)。上下文切換次數(shù)過多表示你的CPU大部分浪費(fèi)在上下文切換,導(dǎo)致CPU干正經(jīng)事的時(shí)間少了谓苟,CPU沒有充分利用官脓,是不可取的。
- us 用戶CPU時(shí)間涝焙,我曾經(jīng)在一個(gè)做加密解密很頻繁的服務(wù)器上卑笨,可以看到us接近100,r運(yùn)行隊(duì)列達(dá)到80(機(jī)器在做壓力測試,性能表現(xiàn)不佳)仑撞。
- sy 系統(tǒng)CPU時(shí)間赤兴,如果太高,表示系統(tǒng)調(diào)用時(shí)間長隧哮,例如是IO操作頻繁桶良。
- id 空閑 CPU時(shí)間,一般來說沮翔,id + us + sy = 100,一般我認(rèn)為id是空閑CPU使用率陨帆,us是用戶CPU使用率,sy是系統(tǒng)CPU使用率采蚀。
- wt 等待IO CPU時(shí)間疲牵。
轉(zhuǎn)載自:Linux vmstat命令實(shí)戰(zhàn)詳解