Arthas
一毙石、簡(jiǎn)介
Arthas 是Alibaba開(kāi)源的Java診斷工具廉沮。安裝在系統(tǒng)所在服務(wù)器。可以幫助開(kāi)發(fā)人員或者運(yùn)維人員查找問(wèn)題销钝,分析性能粟害,bug追蹤。
二巧娱、解決什么問(wèn)題 & 適用場(chǎng)景
解決問(wèn)題:
1匿刮、以全局視角來(lái)查看系統(tǒng)的運(yùn)行狀況扛伍、健康狀況鳞骤。
2窒百、反編譯源碼,查看jvm加載的是否為預(yù)期的文件內(nèi)容豫尽。
3篙梢、查看某個(gè)方法的返回值,參數(shù)等等美旧。
4渤滞、方法內(nèi)調(diào)用路徑及各方法調(diào)用耗時(shí)。
5榴嗅、查看jvm運(yùn)行狀況妄呕。
6、外部.class文件重新加載到j(luò)vm里嗽测。
等等.....
場(chǎng)景:
1)調(diào)用接口時(shí)绪励,接口返回異常信息,如果該異常信息沒(méi)有清晰的定位到代碼唠粥,那么我們通常只能依靠大腦回憶代碼疏魏,來(lái)估計(jì)錯(cuò)誤發(fā)生地了,如果無(wú)法估計(jì)晤愧,一般情況下就會(huì)進(jìn)入測(cè)試環(huán)境大莫,模擬復(fù)現(xiàn),如果無(wú)法復(fù)現(xiàn) _养涮。
2)這個(gè)查詢葵硕,耗時(shí)20s,我們想要分析一下到底是哪些代碼導(dǎo)致的贯吓。但是該方法內(nèi)部又穿插調(diào)用了其它業(yè)務(wù)功能方法懈凹,難道手寫(xiě)System.currentTimeMillis()自己做減運(yùn)算,還是guava的StopWatch亦或是commons的StopWatch悄谐?這幾種方式需要我們手動(dòng)嵌入代碼介评,容易遺漏、費(fèi)力還費(fèi)時(shí)爬舰。
等等们陆,就不一一舉例了。
arthas可以為我們解決上述問(wèn)題情屹,幫助程序員盡早下班坪仇,盡早交代。
三垃你、安裝&啟動(dòng)
啟動(dòng): java -jar arthas-boot.jar
[INFO] arthas-boot version: 3.0.5.2
[INFO] Process 6020 already using port 3658
[INFO] Process 6020 already using port 8563
[INFO] Found existing java process, please choose one and hit RETURN.
*[1]: 6020 org.apache.catalina.startup.Bootstrap
[2]: 16420 org.apache.catalina.startup.Bootstrap
[3]: 7833 org.apache.catalina.startup.Bootstrap
[4]: 19036 org.apache.catalina.startup.Bootstrap
出現(xiàn)上述命令提示椅文,是因?yàn)樵谶@個(gè)服務(wù)器上喂很,存在4個(gè)正在運(yùn)行的java程序,而序號(hào)之后的數(shù)字就是pid皆刺,我們選取對(duì)應(yīng)的pid少辣,然后回車(chē)即可。
[INFO] arthas home: /root/.arthas/lib/3.1.4/arthas
[INFO] The target process already listen port 3658, skip attach.
[INFO] arthas-client connect 127.0.0.1 3658
,---. ,------. ,--------.,--. ,--. ,---. ,---.
/ O \ | .--. ''--. .--'| '--' | / O \ ' .-'
| .-. || '--'.' | | | .--. || .-. |`. `-.
| | | || |\ \ | | | | | || | | |.-' |
`--' `--'`--' '--' `--' `--' `--'`--' `--'`-----'
wiki https://alibaba.github.io/arthas
tutorials https://alibaba.github.io/arthas/arthas-tutorials
version 3.1.4
pid 6020
time 2019-10-14 17:56:41
[arthas@6020]$
啟動(dòng)成功羡蛾!
四漓帅、相關(guān)命令
僅以主要的幾個(gè)命令作為展示,具體命令及參數(shù)可以參閱官方文檔痴怨。
1)輸入dashboard忙干,回車(chē),儀表盤(pán)顯示當(dāng)前進(jìn)程相關(guān)信息腿箩。
____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
| ①Thread相關(guān)信息
| 線程id 線程名稱(chēng) 線程組 線程優(yōu)先級(jí) 線程狀態(tài) 線程消耗的cpu百分比 運(yùn)行總時(shí)間 線程當(dāng)前的中斷位狀態(tài) 是否守護(hù)線程
| ID NAME GROUP PRIORITY STATE %CPU TIME INTERRUPTED DAEMON
| 188 Timer-for-arthas-dashboard-f5864b5b-762a-4fb5-8cc5-65559bd6 system 10 RUNNABLE 19 0:0 false true
| 36 pool-1-thread-1 main 5 TIMED_WAITING 5 0:1 false false
| 33 Abandoned connection cleanup thread main 5 TIMED_WAITING 0 0:0 false true
| 179 AsyncAppender-Worker-arthas-cache.result.AsyncAppender system 9 WAITING 0 0:0 false true
| 12 AsyncFileHandlerWriter-225534817 main 5 TIMED_WAITING 0 0:0 false true
| 94 Attach Listener system 9 RUNNABLE 0 0:0 false true
| 70 ContainerBackgroundProcessor[StandardEngine[Catalina]] main 5 TIMED_WAITING 0 0:0 false true
| 34 Druid-ConnectionPool-Create-300669762 main 5 WAITING 0 0:0 false true
| 35 Druid-ConnectionPool-Destroy-300669762 main 5 TIMED_WAITING 0 0:0 false true
| 3 Finalizer system 8 WAITING 0 0:0 false true
| 13 GC Daemon system 2 TIMED_WAITING 0 0:0 false true
| 14 NioBlockingSelector.BlockPoller-1 main 5 RUNNABLE 0 0:0 false true
| 15 NioBlockingSelector.BlockPoller-2 main 5 RUNNABLE 0 0:0 false true
| 2 Reference Handler system 10 WAITING 0 0:0 false true
| 4 Signal Dispatcher system 9 RUNNABLE 0 0:0 false true
| 76 ajp-nio-38009-Acceptor-0 main 5 RUNNABLE 0 0:0 false true
| 74 ajp-nio-38009-ClientPoller-0 main 5 RUNNABLE 0 0:0 false true
| 75 ajp-nio-38009-ClientPoller-1 main 5 RUNNABLE 0 0:0 false true
| 187 as-command-execute-daemon system 10 TIMED_WAITING 0 0:0 false true
| 73 http-nio-37080-Acceptor-0 main 5 RUNNABLE 0 0:0 false true
| 71 http-nio-37080-ClientPoller-0 main 5 RUNNABLE 0 0:0 false true
| 72 http-nio-37080-ClientPoller-1 main 5 RUNNABLE 0 0:0 false true
|
| ②內(nèi)存信息 ③垃圾回收
| Memory used total max usage GC
| (堆) (垃圾回收次數(shù))
| heap 424M 1897M 1897M 22.37% gc.ps_scavenge.count 19
| (伊甸園) (垃圾回收消耗時(shí)間)
| ps_eden_space 311M 387M 403M 77.28% gc.ps_scavenge.time(ms) 1405
| (幸存者區(qū)) (標(biāo)記-清除算法的次數(shù))
| ps_survivor_space 40M 144M 144M 27.74% gc.ps_marksweep.count 3
| (老年代) (標(biāo)記-清除算法的消耗時(shí)間)
| ps_old_gen 72M 1365M 1365M 5.32% gc.ps_marksweep.time(ms) 446
| (非堆區(qū))
| nonheap 137M 141M -1 97.49%
| (代碼緩存區(qū))
| code_cache 40M 41M 240M 16.99%
| (元空間)
| metaspace 86M 89M -1 97.09%
| (壓縮空間)
| compressed_class_space 10M 10M 1024M 0.99%
| direct 80K 80K - 100.00%
| mapped 0K 0K - NaN%
|
| ④運(yùn)行信息
| Runtime
| os.name Linux
| os.version 3.10.0-957.1.3.el7.x86_64
| java.version 1.8.0_101
| java.home /opt/jdk1.8.0_101/jre
| systemload.average 0.03
| processors 8
| uptime 11956s
|________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
說(shuō)明
ID: Java級(jí)別的線程ID豪直,注意這個(gè)ID不能跟jstack中的nativeID一一對(duì)應(yīng)
NAME: 線程名
GROUP: 線程組名
PRIORITY: 線程優(yōu)先級(jí), 1~10之間的數(shù)字,越大表示優(yōu)先級(jí)越高
STATE: 線程的狀態(tài)
CPU%: 線程消耗的cpu占比珠移,采樣100ms弓乙,將所有線程在這100ms內(nèi)的cpu使用量求和,再算出每個(gè)線程的cpu使用占比钧惧。
TIME: 線程運(yùn)行總時(shí)間暇韧,數(shù)據(jù)格式為分:秒
INTERRUPTED: 線程當(dāng)前的中斷位狀態(tài)
DAEMON: 是否是daemon線程
通過(guò)上述信息,可以幫助我們快速定位相關(guān)問(wèn)題線程浓瞪。
2)查看具體線程信息使用 [thread 線程id]
3)查看類(lèi)里某個(gè)方法的返回值和入?yún)?/p>
命令+類(lèi)完全限定名+監(jiān)測(cè)方法+表達(dá)式
watch cn.asae.e.contract.web.ContractSubjectController getContractSubjectLogs "{params,returnObj}"
表達(dá)式核心變量列表:
loader 本次調(diào)用類(lèi)所在的 ClassLoader
clazz 本次調(diào)用類(lèi)的 Class 引用
method 本次調(diào)用方法反射引用
target 本次調(diào)用類(lèi)的實(shí)例
params 本次調(diào)用參數(shù)列表懈玻,這是一個(gè)數(shù)組,如果方法是無(wú)參方法則為空數(shù)組
returnObj 本次調(diào)用返回的對(duì)象乾颁。當(dāng)且僅當(dāng) isReturn==true 成立時(shí)候有效涂乌,表明方法調(diào)用是以正常返回的方式結(jié)束。如果當(dāng)前方法無(wú)返回值 void英岭,則值為 null
throwExp 本次調(diào)用拋出的異常湾盒。當(dāng)且僅當(dāng) isThrow==true 成立時(shí)有效,表明方法調(diào)用是以拋出異常的方式結(jié)束诅妹。
isBefore 輔助判斷標(biāo)記罚勾,當(dāng)前的通知節(jié)點(diǎn)有可能是在方法一開(kāi)始就通知,此時(shí) isBefore==true 成立吭狡,同時(shí) isThrow==false 和 isReturn==false尖殃,因?yàn)樵诜椒▌傞_(kāi)始時(shí),還無(wú)法確定方法調(diào)用將會(huì)如何結(jié)束划煮。
isThrow 輔助判斷標(biāo)記送丰,當(dāng)前的方法調(diào)用以拋異常的形式結(jié)束。
isReturn 輔助判斷標(biāo)記弛秋,當(dāng)前的方法調(diào)用以正常返回的形式結(jié)束蚪战。
4)方法調(diào)用路徑牵现、耗時(shí)解析
方法內(nèi)部調(diào)用路徑铐懊,并輸出方法路徑上的每個(gè)節(jié)點(diǎn)上耗時(shí)
trace cn.asae.e.contract.web.ContractController getContract
__________________________________________________________________________________________________________________________________________________________________
| 時(shí)間戳 線程名稱(chēng) 線程id 是否守護(hù)進(jìn)程 優(yōu)先級(jí) 線程上下文類(lèi)加載器
| `---ts=2019-10-21 16:33:13;thread_name=http-nio-37080-exec-5;id=52;is_daemon=true;priority=5;TCCL=org.apache.catalina.loader.WebappClassLoader@67fff846 |
| 調(diào)用信息 - 方法攔截器 - 目標(biāo)方法
| `---[1483.931493ms] cn.asae.e.contract.web.ContractController$$EnhancerBySpringCGLIB$$feabdb7f:getContract() |
| `---[1483.715988ms] org.springframework.cglib.proxy.MethodInterceptor:intercept() #0 |
| `---[1482.519392ms] cn.asae.e.contract.web.ContractController:getContract() |
| +---[0.03355ms] cn.asae.core.common.response.v2.ResponseBodyV2:<init>() #243 |
| +---[0.016195ms] cn.asae.core.common.token.TokenCache:getInstance() #246 |
| +---[0.01442ms] cn.asae.core.common.token.TokenCache:get() #246 |
| +---[0.02442ms] cn.asae.e.common.model.Op:createOp() #246 |
| +---[161.579687ms] cn.asae.e.contract.service.ContractService:getContract() #249 |
| +---[164.980125ms] cn.asae.e.contract.service.ContractService:getContractOcrs() #251 |
| +---[0.036474ms] com.google.common.collect.Maps:newHashMap() #255 |
| +---[158.223852ms] cn.asae.e.contract.service.ContractService:getContractMembers() #260 |
| +---[0.025848ms] com.google.common.collect.Lists:newArrayList() #263 |
| +---[0.024837ms] cn.asae.e.contract.model.ContractVO:getContractNum() #264 |
| +---[160.942618ms] cn.asae.e.contract.service.ContractService:getContracts() #266 |
| +---[0.024172ms] org.apache.commons.collections.MapUtils:isNotEmpty() #271 |
| +---[198.281335ms] cn.asae.e.organization.service.AccountService:getAccountLite() #291 |
| +---[159.761087ms] cn.asae.e.organization.service.DepartmentService:getDepartment() #295 |
| +---[0.009013ms] org.apache.commons.collections.MapUtils:isNotEmpty() #297 |
| +---[0.013967ms] cn.asae.e.contract.model.ContractVO:getSignId() #312 |
| +---[0.006482ms] com.google.common.collect.Lists:newArrayList() #312 |
| +---[160.503511ms] cn.asae.e.organization.service.AccountService:getAccountLite() #312 |
| +---[0.015528ms] cn.asae.e.contract.model.ContractVO:getDepartmentId() #316 |
| +---[0.006504ms] com.google.common.collect.Lists:newArrayList() #316 |
| +---[159.023976ms] cn.asae.e.organization.service.DepartmentService:getDepartment() #316 |
| +---[0.005827ms] cn.asae.e.contract.model.ContractVO:getSignId() #319 |
| +---[0.017222ms] cn.asae.e.organization.model.Account:<init>() #319 |
| +---[0.0142ms] cn.asae.e.organization.model.Account:getFullname() #319 |
| +---[0.012931ms] cn.asae.e.contract.model.ContractVO:setSignName() #319 |
| +---[0.00492ms] cn.asae.e.contract.model.ContractVO:getDepartmentId() #321 |
| +---[0.010856ms] cn.asae.e.organization.model.DepartmentVO:<init>() #321 |
| +---[0.018637ms] cn.asae.e.organization.model.DepartmentVO:getName() #323 |
| +---[0.011019ms] cn.asae.e.contract.model.ContractVO:setDepartmentName() #323 |
| +---[0.010145ms] cn.asae.e.organization.model.DepartmentVO:getOrganizationName() #324 |
| +---[0.010541ms] cn.asae.e.contract.model.ContractVO:setOrganizationName() #324 |
| +---[0.005493ms] com.google.common.collect.Maps:newHashMap() #326 |
| +---[0.014093ms] cn.asae.core.common.response.v2.ResponseBodyV2:init() #333 |
| +---[145.783843ms] cn.asae.e.contract.service.ContractService:addContractLog() #335 |
| `---[0.386367ms] cn.asae.core.common.response.v2.ResponseBodyV2:toResponse() #342 |
|________________________________________________________________________________________________________________________________________________________________|
5)時(shí)空隧道
方法執(zhí)行數(shù)據(jù)的時(shí)空隧道邀桑,記錄下指定方法每次調(diào)用的入?yún)⒑头祷匦畔ⅲ⒛軐?duì)這些不同的時(shí)間下調(diào)用進(jìn)行觀測(cè)
tt -t cn.asae.e.contract.web.ContractSubjectController getContractSubjectLogs
-t 代表記錄下每次方法執(zhí)行情況
_________________________________________________________________________________________________________________________________________________________________
| INDEX | TIMESTAMP | COST(ms) | IS-RET | IS-EXP | OBJECT | CLASS | METHOD |
|-------|---------------------|------------|--------|--------|------------|--------------------------------------------------------|----------------------------|
| 1000 | 2019-10-17 16:46:20 | 315.436761 | true | false | 0x2eb74ebb | ContractSubjectController | getContractSubjectLogs |
| 1001 | 2019-10-17 16:46:20 | 326.193324 | true | false | 0xeb982ed6 | ContractSubjectController$$EnhancerBySpringCGLIB$$23d1 | getContractSubjectLogs |
|_______|_____________________|____________|________|________|____________|________________________________________________________|____________________________|
表格字段說(shuō)明
表格字段 字段解釋
INDEX 時(shí)間片段記錄編號(hào)科乎,每一個(gè)編號(hào)代表著一次調(diào)用壁畸,后續(xù)tt還有很多命令都是基于此編號(hào)指定記錄操作,非常重要茅茂。
TIMESTAMP 方法執(zhí)行的本機(jī)時(shí)間捏萍,記錄了這個(gè)時(shí)間片段所發(fā)生的本機(jī)時(shí)間
COST(ms) 方法執(zhí)行的耗時(shí)
IS-RET 方法是否以正常返回的形式結(jié)束
IS-EXP 方法是否以拋異常的形式結(jié)束
OBJECT 執(zhí)行對(duì)象的hashCode(),注意空闲,曾經(jīng)有人誤認(rèn)為是對(duì)象在JVM中的內(nèi)存地址令杈,但很遺憾他不是。但他能幫助你簡(jiǎn)單的標(biāo)記當(dāng)前執(zhí)行方法的類(lèi)實(shí)體
CLASS 執(zhí)行的類(lèi)名
METHOD 執(zhí)行的方法名
為什么調(diào)用一次接口會(huì)出現(xiàn)兩條記錄碴倾?
因?yàn)镾pringMVC初始化時(shí)會(huì)通過(guò)cglib生成ContractSubjectController的代理對(duì)象逗噩,DispatchServlet真正使用的卻是這個(gè)代理對(duì)象,在代理對(duì)象里調(diào)用ContractSubjectController的getContractSubjectLogs方法跌榔,所以當(dāng)我們執(zhí)行tt watch命令時(shí)异雁,會(huì)出現(xiàn)兩條。
順序如下:
ContractSubjectController$$EnhancerBySpringCGLIB$$eefa08b
-> ContractSubjectController
-> getContractSubjectLogs()
往上查找調(diào)用者僧须,并做展示纲刀,我們會(huì)發(fā)現(xiàn)第一條的執(zhí)行時(shí)間略小于第二條的執(zhí)行時(shí)間,基本符合上述我們的推斷担平。
6)查看JVM已加載的類(lèi)信息
sc -d cn.asae.e.contract.web.ContractSubjectController
-d 輸出當(dāng)前類(lèi)的詳細(xì)信息示绊,包括這個(gè)類(lèi)所加載的原始文件來(lái)源、類(lèi)的聲明暂论、加載的ClassLoader等詳細(xì)信息面褐。
如果一個(gè)類(lèi)被多個(gè)ClassLoader所加載,則會(huì)出現(xiàn)多次
____________________________________________________________________________________________________________________________________________
| class-info cn.asae.e.contract.web.ContractSubjectController |
| code-source /opt/tomcat-servers/apache-tomcat-e/webapps/asae-e/WEB-INF/classes/ |
| name cn.asae.e.contract.web.ContractSubjectController |
| isInterface false |
| isAnnotation false |
| isEnum false |
| isAnonymousClass false |
| isArray false |
| isLocalClass false |
| isMemberClass false |
| isPrimitive false |
| isSynthetic false |
| simple-name ContractSubjectController |
| modifier public |
| annotation org.springframework.web.bind.annotation.RestController,org.springframework.web.bind.annotation.RequestMapping |
| interfaces |
| super-class +-java.lang.Object |
| class-loader +-WebappClassLoader |
| context: asae-e |
| delegate: false |
| ----------> Parent Classloader: |
| java.net.URLClassLoader@3af49f1c |
| |
| +-java.net.URLClassLoader@3af49f1c |
| +-sun.misc.Launcher$AppClassLoader@5c647e05 |
| +-sun.misc.Launcher$ExtClassLoader@6537cf78 |
| classLoaderHash 67fff846 |
| |
| class-info cn.asae.e.contract.web.ContractSubjectController$$EnhancerBySpringCGLIB$$8d1d153a |
| code-source /opt/tomcat-servers/apache-tomcat-e/webapps/asae-e/WEB-INF/classes/ |
| name cn.asae.e.contract.web.ContractSubjectController$$EnhancerBySpringCGLIB$$8d1d153a |
| isInterface false |
| isAnnotation false |
| isEnum false |
| isAnonymousClass false |
| isArray false |
| isLocalClass false |
| isMemberClass false |
| isPrimitive false |
| isSynthetic false |
| simple-name ContractSubjectController$$EnhancerBySpringCGLIB$$8d1d153a |
| modifier public |
| annotation |
| interfaces org.springframework.aop.SpringProxy,org.springframework.aop.framework.Advised,org.springframework.cglib.proxy.Factory |
| super-class +-cn.asae.e.contract.web.ContractSubjectController |
| +-java.lang.Object |
| class-loader +-WebappClassLoader |
| context: asae-e |
| delegate: false |
| ----------> Parent Classloader: |
| java.net.URLClassLoader@3af49f1c |
| |
| +-java.net.URLClassLoader@3af49f1c |
| +-sun.misc.Launcher$AppClassLoader@5c647e05 |
| +-sun.misc.Launcher$ExtClassLoader@6537cf78 |
| classLoaderHash 67fff846 |
|__________________________________________________________________________________________________________________________________________|
7)退出arthas
quit —— 退出當(dāng)前 Arthas 客戶端空另,其他 Arthas 客戶端不受影響
shutdown —— 關(guān)閉 Arthas 服務(wù)端盆耽,所有 Arthas 客戶端全部退出 & 重置所有增強(qiáng)過(guò)的類(lèi),就不用單獨(dú)調(diào)用reset
五扼菠、來(lái)自天邊的"海市蜃樓"
Arthas還提供 Web Console摄杂。
java -jar arthas-boot.jar --target-ip 192.168.168.67
在局域網(wǎng)內(nèi),其它機(jī)器可訪問(wèn) http://192.168.168.67:8563
默認(rèn)情況下循榆,arthas只listen 127.0.0.1析恢,所以如果想從遠(yuǎn)程連接,則可以使用 --target-ip參數(shù)指定listen的IP秧饮,更多參考-h的幫助說(shuō)明映挂。 注意會(huì)有安全風(fēng)險(xiǎn)泽篮,考慮tunnel server的方案。
六柑船、結(jié)束
關(guān)于Arthas就簡(jiǎn)單介紹到這里了帽撑,具體使用還要參考官方文檔,希望Arthas能在大家日后的工作學(xué)習(xí)中幫助大家鞍时!