1、perf命令簡(jiǎn)要介紹
性能調(diào)優(yōu)時(shí)声旺,我們通常需要分析查找到程序百分比高的熱點(diǎn)代碼片段钻蹬,這便需要使用 perf record 記錄單個(gè)函數(shù)級(jí)別的統(tǒng)計(jì)信息,并使用 perf report 來(lái)顯示統(tǒng)計(jì)結(jié)果讶凉;
舉例:
sudo perf record -e cpu-clock -g -p 2548 -- sleep 30
-F 表示每秒多少次
-g 選項(xiàng)是告訴perf record額外記錄函數(shù)的調(diào)用關(guān)系
-e cpu-clock 指perf record監(jiān)控的指標(biāo)為cpu周期
-p 指定需要record的進(jìn)程pid
sleep 30則是持續(xù)30秒
程序運(yùn)行完之后,perf record會(huì)生成一個(gè)名為perf.data的文件山孔,如果之前已有懂讯,那么之前的perf.data文件會(huì)被覆蓋
獲得這個(gè)perf.data文件之后,就需要perf report工具進(jìn)行查看
perf report -i perf.data
-i 指定要查看的文件
2台颠、使用火焰圖展示結(jié)果
1褐望、Flame Graph項(xiàng)目位于GitHub上:https://github.com/brendangregg/FlameGraph
2、可以用git將其clone下來(lái):git clone https://github.com/brendangregg/FlameGraph.git
我們以perf為例串前,看一下flamegraph的使用方法:
1瘫里、第一步
$sudo perf record -e cpu-clock -g -p 28591
Ctrl+c結(jié)束執(zhí)行后,在當(dāng)前目錄下會(huì)生成采樣數(shù)據(jù)perf.data.
2荡碾、第二步
用perf script工具對(duì)perf.data進(jìn)行解析
perf script -i perf.data &> perf.unfold
3谨读、第三步
將perf.unfold中的符號(hào)進(jìn)行折疊:
#./stackcollapse-perf.pl perf.unfold &> perf.folded
4、最后生成svg圖:
./flamegraph.pl perf.folded > perf.svg
3坛吁、如何看火焰圖
火焰圖就是看頂層的哪個(gè)函數(shù)占據(jù)的寬度最大劳殖。只要有"平頂"(plateaus)铐尚,就表示該函數(shù)可能存在性能問(wèn)題。