區(qū)域1:反映CPU使用率和工作狀況妓灌。
Kernel:
說明:操作系統(tǒng)的內(nèi)核占用的CPU時間比率。
操作系統(tǒng)作為基礎(chǔ)軟件蜜宪,為應(yīng)用程序支持和服務(wù)的同時虫埂,本身的運行也需要一定的CPU和內(nèi)存資源(順便提到內(nèi)存資源,后面不再闡述這個內(nèi)容了)端壳,特別是內(nèi)存資源告丢,系統(tǒng)負(fù)載越重,相應(yīng)的內(nèi)核占用的CPU和內(nèi)存資源也會越多损谦。一般來說岖免,內(nèi)核占用的CPU時間不會太多的。一般小于應(yīng)用的CPU使用率照捡。
User:
說明:用戶進(jìn)程占用的CPU時間比率颅湘。
這個為CPU使用率的關(guān)鍵數(shù)值。該使用率反映了用戶在操作系統(tǒng)基礎(chǔ)上運行的各種軟件占用的CPU時間比率的總和栗精。一般來說闯参,如果User+Kernel連續(xù)大于70%,即可以認(rèn)為系統(tǒng)可能存在CPU上的嚴(yán)重性能問題悲立。
Wait
說明:CPU處于等待狀態(tài)占CPU時間的比率鹿寨。
CPU的等待一般都為等待IO的響應(yīng),眾所周知薪夕,目前計算機的主要瓶頸都在IO脚草。應(yīng)用程序執(zhí)行的時候,需要讀寫磁盤等外部存儲的數(shù)據(jù)原献,進(jìn)程就會發(fā)起IO請求后等待IO完成馏慨。這個等待的過程占用CPU時間就是wait。當(dāng)這個值很高的時候姑隅,就說明IO來不及響應(yīng)很多的IO請求写隶,這個時候,就只能從IO層面想辦法優(yōu)化了讲仰。
Idle:
說明:CPU空閑時間比率慕趴,這個就不用說了吧。就是CPU多少時間比率在閑著。
CPU占用率出問題的主要可能原因:數(shù)據(jù)庫服務(wù)器執(zhí)行某一個SQL或者存儲過程(存儲過程就是封裝起來的sql程序包而已)需要大量的運算(一般為軟件設(shè)計不合理)秩贰∨常或者應(yīng)用程序中存在異常的地方,比如死循環(huán)毒费,或者其他寫程序時的邏輯錯誤導(dǎo)致丙唧。一般程序出錯會導(dǎo)致一個CPU被全部占用,比如上述的20%占用的原因就是一個交易程序長期占用一個CPU全部時間片(系統(tǒng)共計5個CPU)觅玻。
區(qū)域2:反映網(wǎng)絡(luò)使用率的狀況想际。
Netwok;列出了網(wǎng)卡接口溪厘,KBPS即每秒鐘多少KB(千字節(jié)) I-Pack每秒鐘輸入的數(shù)據(jù)包個數(shù)胡本, O-Pack 每秒鐘輸出的數(shù)據(jù)包個數(shù) KB-In每秒鐘輸入的字節(jié)數(shù)KB-Out每秒鐘輸出的字節(jié)數(shù)。
當(dāng)我們發(fā)現(xiàn)網(wǎng)絡(luò)擁堵時(出現(xiàn)網(wǎng)卡傳輸失效的報錯畸悬,即網(wǎng)卡發(fā)送數(shù)據(jù)包失敗侧甫。或者網(wǎng)絡(luò)響應(yīng)明顯變慢的時候蹋宦,如果CPU沒有問題披粟,那么請檢查網(wǎng)絡(luò)流量)發(fā)現(xiàn)某一個網(wǎng)卡的KBPS持續(xù)大于四位數(shù),甚至五位數(shù)時(這個值要是網(wǎng)卡千兆還是百兆而定)冷冗。就要看看這個網(wǎng)卡是什么網(wǎng)卡守屉,在處理什么業(yè)務(wù)了。在命令行執(zhí)行netstat–in 查看對應(yīng)en接口的ip地址蒿辙,通過ip地址看看是帶官網(wǎng)卡還是生產(chǎn)服務(wù)網(wǎng)卡流量高拇泛。然后通過netstat–v en 看看網(wǎng)卡的詳細(xì)工作狀態(tài),出現(xiàn)了多少錯包思灌,沖突包俺叭,crc校驗錯或者網(wǎng)絡(luò)重置過等信息。上述信息請詳細(xì)看netstat–v en*的輸出.如果出現(xiàn)大量crc泰偿,錯包的話绪颖,可能網(wǎng)線有問題或者接觸不良。
如果上述均正常甜奄,而網(wǎng)絡(luò)反應(yīng)慢,則有可能是交換機擁堵窃款。
網(wǎng)絡(luò)出現(xiàn)問題的可能原因:通過百兆的帶管網(wǎng)加載大量數(shù)據(jù)(以前出現(xiàn)過)课兄,大量隊列的長時間的ftp傳輸,或者網(wǎng)線晨继,交換機問題等烟阐。
區(qū)域3:反映磁盤使用率的狀況。
Disk Busy%磁盤繁忙的百分比,即磁盤能滿足的最大IOPS(每秒IO操作數(shù))和當(dāng)前IO數(shù)量的比率蜒茄。其他的參數(shù)不再解釋唉擂。望文生義即可。
一般主要看磁盤的Busy%,當(dāng)磁盤的Busy%持續(xù)大于85%時檀葛,即認(rèn)為磁盤相當(dāng)繁忙玩祟,已經(jīng)可能要出問題了。當(dāng)然屿聋,自己知道已經(jīng)確定要產(chǎn)生大量IO操作的內(nèi)容則不必在意空扎,等其完成即可。
出現(xiàn)問題的原因:應(yīng)用服務(wù)器上面寫日志進(jìn)程或者查詢?nèi)罩镜倪M(jìn)程大量讀寫日志润讥,導(dǎo)致磁盤繁忙率高撮慨,或者其他程序頻繁讀寫磁盤導(dǎo)致脆粥。系統(tǒng)中hdisk0砌溺,hdisk1一般為系統(tǒng)盤,內(nèi)置SCSI磁盤的相對IOPS是較低的冠绢。很容易滿負(fù)荷運行抚吠。
區(qū)域4:反映進(jìn)程信息的狀況。
Name:進(jìn)程的名稱弟胀,即進(jìn)程被執(zhí)行時啟動的二進(jìn)制文件的名稱楷力。
PID,進(jìn)程的ID孵户,進(jìn)程的ID在系統(tǒng)中唯一夏哭,是我們了解跟蹤進(jìn)程信息重要數(shù)值检柬。
跟蹤進(jìn)程的CPU使用,磁盤IO讀寫竖配,進(jìn)程的內(nèi)存和pagingspace占用等等均需要使用何址。
CPU%進(jìn)程占用CPU時間的比率。
PgSp胁镐,進(jìn)程占用的pagingspace的空間大小偎血。
Owner進(jìn)程的屬主诸衔,即由哪個操作用戶用戶啟動了這個進(jìn)程。
在topas中颇玷,默認(rèn)是列出占用cpu最高的前幾個的進(jìn)程信息供參考笨农,如果前面第一區(qū)域的的CPU使用率持續(xù)高,就要看看這里是那個進(jìn)程占用了大量的CPU資源帖渠,看看是哪個用戶的進(jìn)程谒亦,如果自己執(zhí)行的,則殺掉或者找項目組解決即可阿弃。
區(qū)域5:反映內(nèi)存頁面和換頁空間信息的狀況诊霹。
換頁空間即磁盤上的空間,在AIX操作系統(tǒng)中用來做內(nèi)存空間使用渣淳。具體的理論就不再闡述了脾还,詳細(xì)信息請參閱操作系統(tǒng)內(nèi)容。磁盤空間的速度當(dāng)然相比內(nèi)存入愧,慢了不止10倍鄙漏。所以,只是內(nèi)存頁面的一個暫時存放地棺蛛,存放的還是那些長期不怎么用到的內(nèi)存頁面而已怔蚌。如果paging大量出現(xiàn),這時候就有麻煩了旁赊,說明:內(nèi)存不夠用了桦踊!
該區(qū)域主要關(guān)注PageIn,PageOut如果這兩個數(shù)值均大于三位數(shù)终畅,并且長期大于這個數(shù)值籍胯,在技術(shù)上叫做內(nèi)存顛簸,即不停的把內(nèi)存頁面換到磁盤空間上离福,又從磁盤空間把內(nèi)存頁面讀進(jìn)來杖狼,系統(tǒng)的內(nèi)存使用效率變的極差,系統(tǒng)響應(yīng)性能也變慢了妖爷。
這個信息也可以用vmstat來看蝶涩,pi和po列即與這里相對應(yīng)。當(dāng)然絮识,如果只是有頁面出绿聘,或者只有頁面入,或者短時間的一些頁面換入換出次舌,則沒有什么問題熄攘,關(guān)注一下即可。
區(qū)域6:反映內(nèi)存使用的信息垃它。
Real,MB操作系統(tǒng)實際擁有的內(nèi)存的總量,單位是MB国拇。
%Comp洛史,計算型內(nèi)存占用比率,%Noncomp非計算型內(nèi)存占用的比率酱吝。
%Client也為非計算型內(nèi)存也殖,Noncomp包涵Client型內(nèi)存,jfs文件系統(tǒng)使用的內(nèi)存為noncomp务热,為了區(qū)分忆嗜,jfs2和nfs使用的內(nèi)存為Client。
計算型內(nèi)存就是進(jìn)程實際使用的內(nèi)存崎岂,例如我們寫程序的時候malloc內(nèi)存捆毫,或者在排序中使用了堆棧,進(jìn)程中變量數(shù)值都需要在內(nèi)存中保存冲甘,這部分內(nèi)存為計算型內(nèi)存(闡述不全面绩卤,僅供參考)。而操作系統(tǒng)在進(jìn)行文件讀寫江醇,需要的io緩沖區(qū)濒憋,或者我們在寫程序的時候,打開文件陶夜,讀寫文件凛驮,均在文件緩沖區(qū)進(jìn)行。(裸設(shè)備例外条辟,CCCC的數(shù)據(jù)庫采用RAC黔夭,數(shù)據(jù)的存儲全部使用裸設(shè)備,在數(shù)據(jù)庫服務(wù)器上捂贿,數(shù)據(jù)文件的緩沖在oracle的sga區(qū)的databuffer中(這個區(qū)域系統(tǒng)認(rèn)為是計算型內(nèi)存)纠修,是不會占用非計算內(nèi)存的。)
導(dǎo)致內(nèi)存出問題的可能原因很多厂僧。主要有:進(jìn)程使用了更多的內(nèi)存扣草,例如,CCCC數(shù)據(jù)庫服務(wù)器大量的oracle連接使用了很多內(nèi)存颜屠,或者數(shù)據(jù)庫中執(zhí)行的某一個sql腳本或者存儲過程的執(zhí)行需要大量的內(nèi)存來完成其操作(特例庫中出現(xiàn)過這個情形辰妙,一個存儲過程的執(zhí)行導(dǎo)致操作系統(tǒng)內(nèi)存被耗盡,pg也隨之耗盡甫窟,操作系統(tǒng)自動執(zhí)行PGSP_KILL,把該進(jìn)程給干掉了密浑,我也是第一次知道aix系統(tǒng)還有這個功能,呵呵)粗井。第二個主要的問題就是內(nèi)存泄漏尔破,內(nèi)存泄漏最簡單的來說街图,就是申請了內(nèi)存空間,使用后不再使用了懒构,但是也沒有釋放餐济。我們寫程序的時候malloc,卻沒有free胆剧。這就導(dǎo)致了嚴(yán)重的問題絮姆,隨著程序的執(zhí)行,可用物理內(nèi)存越來越少秩霍,最后就掛了篙悯,只好定期重啟應(yīng)用來解決。
操作系統(tǒng)的內(nèi)存換頁機制導(dǎo)致了程序中不用的內(nèi)存頁面最后都跑到pg上面去了铃绒,換頁空間會持續(xù)增長的鸽照。因應(yīng)用導(dǎo)致系統(tǒng)問題就是這么產(chǎn)生的。
區(qū)域7反映的是換頁空間的使用率匿垄。
如果換頁空間的使用率長期增長移宅,就說明系統(tǒng)內(nèi)存不足,已經(jīng)開始使用磁盤空間來緩沖內(nèi)存了椿疗,如果PG使用率持續(xù)增長漏峰,或者大于50%,需要警惕(到50%在監(jiān)控平臺已經(jīng)是主要告警啦=扉)浅乔,并馬上提交系統(tǒng)管理員分析內(nèi)存增長原因。如果該數(shù)值持續(xù)增長铝条,系統(tǒng)一定會掛掉的靖苇!
TOPAS
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
- 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來旨怠,“玉大人渠驼,你說我怎么就攤上這事〖澹” “怎么了迷扇?”我有些...
- 文/不壞的土叔 我叫張陵百揭,是天一觀的道長。 經(jīng)常有香客問我蜓席,道長信峻,這世上最難降的妖魔是什么? 我笑而不...
- 正文 為了忘掉前任瓮床,我火速辦了婚禮,結(jié)果婚禮上产镐,老公的妹妹穿的比我還像新娘隘庄。我一直安慰自己,他們只是感情好癣亚,可當(dāng)我...
- 文/花漫 我一把揭開白布丑掺。 她就那樣靜靜地躺著,像睡著了一般述雾。 火紅的嫁衣襯著肌膚如雪街州。 梳的紋絲不亂的頭發(fā)上,一...
- 文/蒼蘭香墨 我猛地睜開眼趟紊,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了碰酝?” 一聲冷哼從身側(cè)響起霎匈,我...
- 正文 年R本政府宣布,位于F島的核電站历极,受9級特大地震影響窄瘟,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜趟卸,卻給世界環(huán)境...
- 文/蒙蒙 一蹄葱、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧锄列,春花似錦图云、人聲如沸。這莊子的主人今日做“春日...
- 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至筒严,卻和暖如春丹泉,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背鸭蛙。 一陣腳步聲響...
推薦閱讀更多精彩內(nèi)容
- 必備的理論基礎(chǔ) 1.操作系統(tǒng)作用: 隱藏丑陋復(fù)雜的硬件接口,提供良好的抽象接口贪磺。 管理調(diào)度進(jìn)程硫兰,并將多個進(jìn)程對硬件...
- 1.內(nèi)存的頁面置換算法 (1)最佳置換算法(OPT)(理想置換算法):從主存中移出永遠(yuǎn)不再需要的頁面刹前;如無這樣的...
- 文/tangsl(簡書作者) 原文鏈接:http://www.reibang.com/p/2b993a4b913e...
- 又來到了一個老生常談的問題泳赋,應(yīng)用層軟件開發(fā)的程序員要不要了解和深入學(xué)習(xí)操作系統(tǒng)呢? 今天就這個問題開始喇喉,來談?wù)劜?..
- linux是當(dāng)前在服務(wù)器領(lǐng)域最成功操作系統(tǒng)祖今,不僅性能卓越,安全性高,更重要的是提供了一套完善的監(jiān)控機制千诬,來檢測系統(tǒng)...