接入層問題故障定位

1. 背景

有時(shí)候會(huì)遇到一些疑難雜癥，并且監(jiān)控插件并不能一眼立馬發(fā)現(xiàn)問題的根源采桃。這時(shí)候就需要登錄服務(wù)器進(jìn)一步深入分析問題的根源懒熙。那么分析問題需要有一定的技術(shù)經(jīng)驗(yàn)積累，并且有些問題涉及到的領(lǐng)域非常廣普办，才能定位到問題工扎。所以，分析問題和踩坑是非常鍛煉一個(gè)人的成長和提升自我能力衔蹲。如果我們有一套好的分析工具肢娘，那將是事半功倍，能夠幫助大家快速定位問題舆驶，節(jié)省大家很多時(shí)間做更深入的事情橱健。

2. 說明

本篇文章主要介紹各種問題定位的工具以及會(huì)結(jié)合案例分析問題。

3. 分析問題的方法論

套用5W2H方法沙廉，可以提出性能分析的幾個(gè)問題

What-現(xiàn)象是什么樣的
When-什么時(shí)候發(fā)生
Why-為什么會(huì)發(fā)生
Where-哪個(gè)地方發(fā)生的問題
How much-耗費(fèi)了多少資源
How to do-怎么解決問題

4. cpu

4.1 說明

針對(duì)應(yīng)用程序拘荡，我們通常關(guān)注的是內(nèi)核CPU調(diào)度器功能和性能。

線程的狀態(tài)分析主要是分析線程的時(shí)間用在什么地方撬陵，而線程狀態(tài)的分類一般分為：

a. on-CPU：執(zhí)行中珊皿，執(zhí)行中的時(shí)間通常又分為用戶態(tài)時(shí)間user和系統(tǒng)態(tài)時(shí)間sys。
b. off-CPU：等待下一輪上CPU巨税，或者等待I/O蟋定、鎖、換頁等等草添，其狀態(tài)可以細(xì)分為可執(zhí)行驶兜、匿名換頁、睡眠、鎖抄淑、空閑等狀態(tài)犀盟。

如果大量時(shí)間花在CPU上，對(duì)CPU的剖析能夠迅速解釋原因蝇狼；如果系統(tǒng)時(shí)間大量處于off-cpu狀態(tài)，定位問題就會(huì)費(fèi)時(shí)很多倡怎。但是仍然需要清楚一些概念：

處理器
核
硬件線程
CPU內(nèi)存緩存
時(shí)鐘頻率
每指令周期數(shù)CPI和每周期指令數(shù)IPC
CPU指令
使用率
用戶時(shí)間／內(nèi)核時(shí)間
調(diào)度器
運(yùn)行隊(duì)列
搶占
多進(jìn)程
多線程
字長

4.2 分析工具

工具	描述
uptime	平均負(fù)載
vmstat	包括系統(tǒng)范圍的cpu平均負(fù)載
mpstat	查看所有cpu核信息
top	監(jiān)控每個(gè)進(jìn)程cpu用量
sar -u	查看cpu信息
pidstat	每個(gè)進(jìn)程cpu用量分解
perf	cpu剖析和跟蹤迅耘，性能計(jì)數(shù)分析

說明:

uptime,vmstat,mpstat,top,pidstat只能查詢到cpu及負(fù)載的的使用情況。
perf可以跟著到進(jìn)程內(nèi)部具體函數(shù)耗時(shí)情況监署，并且可以指定內(nèi)核函數(shù)進(jìn)行統(tǒng)計(jì)颤专，指哪打哪。

4.3 使用方式

//查看系統(tǒng)cpu使用情況
top

//查看所有cpu核信息
mpstat -P ALL 1

//查看cpu使用情況以及平均負(fù)載
vmstat 1

//進(jìn)程cpu的統(tǒng)計(jì)信息
pidstat -u 1 -p pid

//跟蹤進(jìn)程內(nèi)部函數(shù)級(jí)cpu使用情況
perf top -p pid -e cpu-clock

5. 內(nèi)存

5.1 說明

內(nèi)存是為提高效率而生钠乏，實(shí)際分析問題的時(shí)候栖秕，內(nèi)存出現(xiàn)問題可能不只是影響性能，而是影響服務(wù)或者引起其他問題晓避。同樣對(duì)于內(nèi)存有些概念需要清楚：

主存
虛擬內(nèi)存
常駐內(nèi)存
地址空間
OOM
頁緩存
缺頁
換頁
交換空間
交換
用戶分配器libc簇捍、glibc、libmalloc和mtmalloc
LINUX內(nèi)核級(jí)SLUB分配器

5.2 分析工具

工具	描述
free	緩存容量統(tǒng)計(jì)信息
vmstat	虛擬內(nèi)存統(tǒng)計(jì)信息
top	監(jiān)視每個(gè)進(jìn)程的內(nèi)存使用情況
pidstat	顯示活動(dòng)進(jìn)程的內(nèi)存使用統(tǒng)計(jì)
pmap	查看進(jìn)程的內(nèi)存映像信息
sar -r	查看內(nèi)存
dtrace	動(dòng)態(tài)跟蹤
valgrind	分析程序性能及程序中的內(nèi)存泄露錯(cuò)誤

說明：

free,vmstat,top,pidstat,pmap只能統(tǒng)計(jì)內(nèi)存信息以及進(jìn)程的內(nèi)存使用情況俏拱。
valgrind可以分析內(nèi)存泄漏問題暑塑。
dtrace動(dòng)態(tài)跟蹤。需要對(duì)內(nèi)核函數(shù)有很深入的了解锅必，通過D語言編寫腳本完成跟蹤事格。

5.3 使用方式

//查看系統(tǒng)內(nèi)存使用情況
free -m

//虛擬內(nèi)存統(tǒng)計(jì)信息
vmstat 1

//查看系統(tǒng)內(nèi)存情況
top

//1s采集周期，獲取內(nèi)存的統(tǒng)計(jì)信息
pidstat -p pid -r 1

//查看進(jìn)程的內(nèi)存映像信息
pmap -d pid

//檢測(cè)程序內(nèi)存問題
valgrind --tool=memcheck --leak-check=full --log-file=./log.txt  ./程序名

6. 磁盤IO

6.1 說明

磁盤通常是計(jì)算機(jī)最慢的子系統(tǒng)搞隐，也是最容易出現(xiàn)性能瓶頸的地方驹愚，因?yàn)榇疟P離 CPU 距離最遠(yuǎn)而且 CPU 訪問磁盤要涉及到機(jī)械操作，比如轉(zhuǎn)軸劣纲、尋軌等逢捺。訪問硬盤和訪問內(nèi)存之間的速度差別是以數(shù)量級(jí)來計(jì)算的，就像1天和1分鐘的差別一樣味廊。要監(jiān)測(cè) IO 性能蒸甜，有必要了解一下基本原理和 Linux 是如何處理硬盤和內(nèi)存之間的 IO 的。

在理解磁盤IO之前余佛，同樣我們需要理解一些概念柠新，例如：

文件系統(tǒng)
VFS
文件系統(tǒng)緩存
頁緩存page cache
緩沖區(qū)高速緩存buffer cache
目錄緩存
inode
inode緩存
noop調(diào)用策略

6.2 分析工具

工具	描述
iostat	磁盤詳細(xì)統(tǒng)計(jì)信息
iotop	按進(jìn)程查看磁盤IO的使用情況
pidstat	按進(jìn)程查看磁盤IO的使用情況
perf	動(dòng)態(tài)跟蹤工具

6.3 使用方式

//查看系統(tǒng)io信息
iotop

//統(tǒng)計(jì)io詳細(xì)信息
iostat -d -x -k 1 10

//查看進(jìn)程級(jí)io的信息
pidstat -d 1 -p  pid

//查看系統(tǒng)IO的請(qǐng)求，比如可以在發(fā)現(xiàn)系統(tǒng)IO異常時(shí)辉巡，可以使用該命令進(jìn)行調(diào)查恨憎，就能指定到底是什么原因?qū)е碌腎O異常
perf record -e block:block_rq_issue -ag
^C
perf report

7. 網(wǎng)絡(luò)

7.1 說明

網(wǎng)絡(luò)的監(jiān)測(cè)是所有 Linux 子系統(tǒng)里面最復(fù)雜的，有太多的因素在里面，比如：延遲憔恳、阻塞瓤荔、沖突、丟包等钥组，更糟的是與 Linux 主機(jī)相連的路由器输硝、交換機(jī)、無線信號(hào)都會(huì)影響到整體網(wǎng)絡(luò)并且很難判斷是因?yàn)?Linux 網(wǎng)絡(luò)子系統(tǒng)的問題還是別的設(shè)備的問題程梦，增加了監(jiān)測(cè)和判斷的復(fù)雜度〉惆眩現(xiàn)在我們使用的所有網(wǎng)卡都稱為自適應(yīng)網(wǎng)卡，意思是說能根據(jù)網(wǎng)絡(luò)上的不同網(wǎng)絡(luò)設(shè)備導(dǎo)致的不同網(wǎng)絡(luò)速度和工作模式進(jìn)行自動(dòng)調(diào)整屿附。

7.2 分析工具

工具	描述
ping	主要透過 ICMP 封包來進(jìn)行整個(gè)網(wǎng)絡(luò)的狀況報(bào)告
traceroute	用來檢測(cè)發(fā)出數(shù)據(jù)包的主機(jī)到目標(biāo)主機(jī)之間所經(jīng)過的網(wǎng)關(guān)數(shù)量的工具
netstat	用于顯示與IP郎逃、TCP、UDP和ICMP協(xié)議相關(guān)的統(tǒng)計(jì)數(shù)據(jù)挺份，一般用于檢驗(yàn)本機(jī)各端口的網(wǎng)絡(luò)連接情況
ss	可以用來獲取socket統(tǒng)計(jì)信息褒翰，而且比netstat更快速更高效
host	可以用來查出某個(gè)主機(jī)名的 IP,跟nslookup作用一樣
tcpdump	是以包為單位進(jìn)行輸出的，閱讀起來不是很方便
tcpflow	是面向tcp流的, 每個(gè)tcp傳輸會(huì)保存成一個(gè)文件,很方便的查看
sar -n DEV	網(wǎng)卡流量情況
sar -n SOCK	查詢網(wǎng)絡(luò)以及tcp匀泊，udp狀態(tài)信息

7.3 使用方式

//顯示網(wǎng)絡(luò)統(tǒng)計(jì)信息
netstat -s

//顯示當(dāng)前UDP連接狀況
netstat -nu

//顯示UDP端口號(hào)的使用情況
netstat -apu

//統(tǒng)計(jì)機(jī)器中網(wǎng)絡(luò)連接各個(gè)狀態(tài)個(gè)數(shù)
netstat -a | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'

//顯示TCP連接
ss -t -a

//顯示sockets摘要信息
ss -s

//顯示所有udp sockets
ss -u -a

//tcp,etcp狀態(tài)
sar -n TCP,ETCP 1

//查看網(wǎng)絡(luò)IO
sar -n DEV 1

//抓包以包為單位進(jìn)行輸出
tcpdump -i eth1 host 192.168.1.1 and port 80 

//抓包以流為單位顯示數(shù)據(jù)內(nèi)容
tcpflow -cp host 192.168.1.1

8. 系統(tǒng)負(fù)載

8.1 說明

Load 就是對(duì)計(jì)算機(jī)干活多少的度量（WikiPedia：the system Load is a measure of the amount of work that a compute system is doing）簡單的說是進(jìn)程隊(duì)列的長度优训。Load Average 就是一段時(shí)間（1分鐘、5分鐘各聘、15分鐘）內(nèi)平均Load型宙。

8.2 分析工具

工具	描述
top	查看系統(tǒng)負(fù)載情況
uptime	查看系統(tǒng)負(fù)載情況
strace	統(tǒng)計(jì)跟蹤內(nèi)核態(tài)信息
vmstat	查看負(fù)載情況
dmesg	查看內(nèi)核日志信息

8.3使用方式

//查看負(fù)載情況
uptime

top

vmstat

//統(tǒng)計(jì)系統(tǒng)調(diào)用耗時(shí)情況
strace -c -p pid

//跟蹤指定的系統(tǒng)操作例如epoll_wait
strace -T -e epoll_wait -p pid

//查看內(nèi)核日志信息
dmesg

9. 火焰圖

9.1 說明

火焰圖（Flame Graph是 Bredan Gregg 創(chuàng)建的一種性能分析圖表，因?yàn)樗臉幼咏??而得名伦吠。
火焰圖主要是用來展示 CPU的調(diào)用棧妆兑。
y 軸表示調(diào)用棧，每一層都是一個(gè)函數(shù)毛仪。調(diào)用棧越深搁嗓，火焰就越高，頂部就是正在執(zhí)行的函數(shù)箱靴，下方都是它的父函數(shù)腺逛。
x 軸表示抽樣數(shù)，如果一個(gè)函數(shù)在 x 軸占據(jù)的寬度越寬衡怀，就表示它被抽到的次數(shù)多棍矛，即執(zhí)行的時(shí)間長。注意抛杨，x 軸不代表時(shí)間够委，而是所有的調(diào)用棧合并后，按字母順序排列的怖现。

火焰圖就是看頂層的哪個(gè)函數(shù)占據(jù)的寬度最大茁帽。只要有”平頂”（plateaus）玉罐，就表示該函數(shù)可能存在性能問題。顏色沒有特殊含義潘拨，因?yàn)榛鹧鎴D表示的是 CPU 的繁忙程度吊输，所以一般選擇暖色調(diào)。

常見的火焰圖類型有On-CPU铁追、Off-CPU季蚂、Memory、Hot/Cold琅束、Differential等等癣蟋。

9.2 安裝依賴庫

//安裝systemtap，默認(rèn)系統(tǒng)已安裝
yum install systemtap systemtap-runtime

//內(nèi)核調(diào)試庫必須跟內(nèi)核版本對(duì)應(yīng)狰闪，例如：uname -r 2.6.18-308.el5
kernel-debuginfo-2.6.18-308.el5.x86_64.rpm
kernel-devel-2.6.18-308.el5.x86_64.rpm
kernel-debuginfo-common-2.6.18-308.el5.x86_64.rpm

//安裝內(nèi)核調(diào)試庫
debuginfo-install --enablerepo=debuginfo search kernel
debuginfo-install --enablerepo=debuginfo  search glibc

9.3 安裝

git clone https://github.com/lidaohang/quick_location.git
cd quick_location

9.4 CPU級(jí)別火焰圖

cpu占用過高，或者使用率提不上來濒生，你能快速定位到代碼的哪塊有問題嗎埋泵？
一般的做法可能就是通過日志等方式去確定問題。現(xiàn)在我們有了火焰圖罪治，能夠非常清晰的發(fā)現(xiàn)哪個(gè)函數(shù)占用cpu過高丽声，或者過低導(dǎo)致的問題。

9.4.1 on-CPU

cpu占用過高觉义，執(zhí)行中的時(shí)間通常又分為用戶態(tài)時(shí)間user和系統(tǒng)態(tài)時(shí)間sys雁社。

使用方式：

//on-CPU user
sh ngx_on_cpu_u.sh pid

//進(jìn)入結(jié)果目錄
cd ngx_on_cpu_u

//on-CPU kernel
sh ngx_on_cpu_k.sh pid

//進(jìn)入結(jié)果目錄
cd ngx_on_cpu_k

//開一個(gè)臨時(shí)端口8088
python -m SimpleHTTPServer 8088

//打開瀏覽器輸入地址
127.0.0.1:8088/pid.svg

DEMO：

#include <stdio.h>
#include <stdlib.h>

void foo3()
{
}

void foo2()
{
  int i;
  for(i=0 ; i < 10; i++)
       foo3();
}

void foo1()
{
  int i;
  for(i = 0; i< 1000; i++)
     foo3();
}

int main(void)
{
  int i;
  for( i =0; i< 1000000000; i++) {
      foo1();
      foo2();
  }
}

DEMO火焰圖：

image

9.4.2 off-CPU

cpu過低，利用率不高晒骇。等待下一輪CPU霉撵，或者等待I/O、鎖洪囤、換頁等等徒坡，其狀態(tài)可以細(xì)分為可執(zhí)行、匿名換頁瘤缩、睡眠喇完、鎖、空閑等狀態(tài)剥啤。

使用方式：

// off-CPU user
sh ngx_off_cpu_u.sh pid

//進(jìn)入結(jié)果目錄
cd ngx_off_cpu_u

//off-CPU kernel
sh ngx_off_cpu_k.sh pid

//進(jìn)入結(jié)果目錄
cd ngx_off_cpu_k

//開一個(gè)臨時(shí)端口8088
python -m SimpleHTTPServer 8088

//打開瀏覽器輸入地址
127.0.0.1:8088/pid.svg

官網(wǎng)DEMO：

image.png

9.5 內(nèi)存級(jí)別火焰圖

如果線上程序出現(xiàn)了內(nèi)存泄漏锦溪，并且只在特定的場(chǎng)景才會(huì)出現(xiàn)。這個(gè)時(shí)候我們?cè)趺崔k呢府怯？有什么好的方式和工具能快速的發(fā)現(xiàn)代碼的問題呢刻诊？同樣內(nèi)存級(jí)別火焰圖幫你快速分析問題的根源。

使用方式：

sh ngx_on_memory.sh pid

//進(jìn)入結(jié)果目錄
cd ngx_on_memory

//開一個(gè)臨時(shí)端口8088
python -m SimpleHTTPServer 8088

//打開瀏覽器輸入地址
127.0.0.1:8088/pid.svg?

官網(wǎng)DEMO：

image.png

9.6 性能回退-紅藍(lán)差分火焰圖

你能快速定位CPU性能回退的問題么牺丙？如果你的工作環(huán)境非常復(fù)雜且變化快速坏逢，那么使用現(xiàn)有的工具是來定位這類問題是很具有挑戰(zhàn)性的。當(dāng)你花掉數(shù)周時(shí)間把根因找到時(shí)，代碼已經(jīng)又變更了好幾輪是整，新的性能問題又冒了出來肖揣。主要可以用到每次構(gòu)建中，每次上線做對(duì)比看浮入，如果損失嚴(yán)重可以立馬解決修復(fù)龙优。

通過抓取了兩張普通的火焰圖，然后進(jìn)行對(duì)比事秀，并對(duì)差異部分進(jìn)行標(biāo)色：紅色表示上升彤断，藍(lán)色表示下降。差分火焰圖是以當(dāng)前（“修改后”）的profile文件作為基準(zhǔn)易迹，形狀和大小都保持不變宰衙。因此你通過色彩的差異就能夠很直觀的找到差異部分，且可以看出為什么會(huì)有這樣的差異睹欲。

使用方式：

cd quick_location

//抓取代碼修改前的profile 1文件
perf record -F 99 -p pid -g -- sleep 30
perf script > out.stacks1

//抓取代碼修改后的profile 2文件
perf record -F 99 -p pid -g -- sleep 30
perf script > out.stacks2

//生成差分火焰圖:
./FlameGraph/stackcollapse-perf.pl ../out.stacks1 > out.folded1
./FlameGraph/stackcollapse-perf.pl ../out.stacks2 > out.folded2
./FlameGraph/difffolded.pl out.folded1 out.folded2 | ./FlameGraph/flamegraph.pl > diff2.svg

DEMO：

//test.c
#include <stdio.h>
#include <stdlib.h>

void foo3()
{
}

void foo2()
{
  int i;
  for(i=0 ; i < 10; i++)
       foo3();
}

void foo1()
{
  int i;
  for(i = 0; i< 1000; i++)
     foo3();
}

int main(void)
{
  int i;
  for( i =0; i< 1000000000; i++) {
      foo1();
      foo2();
  }
}

//test1.c
#include <stdio.h>
#include <stdlib.h>

void foo3()
{
}

void foo2()
{
  int i;
  for(i=0 ; i < 10; i++)
       foo3();
}

void foo1()
{
  int i;
  for(i = 0; i< 1000; i++)
     foo3();
}

void add()
{
  int i;
  for(i = 0; i< 10000; i++)
     foo3();
}

int main(void)
{
  int i;
  for( i =0; i< 1000000000; i++) {
      foo1();
      foo2();
      add();
  }
}

DEMO紅藍(lán)差分火焰圖：

diff (1).png

10. 案例分析

10.1 接入層nginx集群異彻┝叮現(xiàn)象

通過監(jiān)控插件發(fā)現(xiàn)在2017.09.25 19點(diǎn)nginx集群請(qǐng)求流量出現(xiàn)大量的499，5xx狀態(tài)碼窘疮。并且發(fā)現(xiàn)機(jī)器cpu使用率升高袋哼，目前一直持續(xù)中。

10.2 分析nginx相關(guān)指標(biāo)

a) ****分析nginx請(qǐng)求流量：

image.png

結(jié)論：

通過上圖發(fā)現(xiàn)流量并沒有突增闸衫，反而下降了涛贯，跟請(qǐng)求流量突增沒關(guān)系。

b) ****分析nginx響應(yīng)時(shí)間

image.png

結(jié)論：

通過上圖發(fā)現(xiàn)nginx的響應(yīng)時(shí)間有增加可能跟nginx自身有關(guān)系或者跟后端upstream響應(yīng)時(shí)間有關(guān)系蔚出。

c) ****分析nginx upstream響應(yīng)時(shí)間

image.png

結(jié)論：

通過上圖發(fā)現(xiàn)nginx upstream 響應(yīng)時(shí)間有增加弟翘，目前猜測(cè)可能后端upstream響應(yīng)時(shí)間拖住nginx，導(dǎo)致nginx出現(xiàn)請(qǐng)求流量異常骄酗。

10.3 分析系統(tǒng)cpu情況

a) ****通過top觀察系統(tǒng)指標(biāo)

top

image.png

結(jié)論：

發(fā)現(xiàn)nginx worker cpu比較高

b) ****分析nginx進(jìn)程內(nèi)部cpu情況

perf top -p pid

image.png

結(jié)論：

發(fā)現(xiàn)主要開銷在free,malloc,json解析上面

10.4 火焰圖分析cpu

a) ****生成用戶態(tài)cpu火焰圖

//on-CPU user
sh ngx_on_cpu_u.sh pid

//進(jìn)入結(jié)果目錄
cd ngx_on_cpu_u

//開一個(gè)臨時(shí)端口8088
python -m SimpleHTTPServer 8088

//打開瀏覽器輸入地址
127.0.0.1:8088/pid.svg

image.png

結(jié)論：

發(fā)現(xiàn)代碼里面有頻繁的解析json操作衅胀，并且發(fā)現(xiàn)這個(gè)json庫性能不高，占用cpu挺高酥筝。

10.5 案例總結(jié)

**a) **分析請(qǐng)求流量異常滚躯，得出nginx upstream后端機(jī)器響應(yīng)時(shí)間拉長

**b) **分析nginx進(jìn)程cpu高，得出nginx內(nèi)部模塊代碼有耗時(shí)的json解析以及內(nèi)存分配回收操作

10.5.1 深入分析

根據(jù)以上兩點(diǎn)問題分析的結(jié)論嘿歌，我們進(jìn)一步深入分析掸掏。

后端upstream響應(yīng)拉長，最多可能影響nginx的處理能力宙帝。但是不可能會(huì)影響nginx內(nèi)部模塊占用過多的cpu操作丧凤。并且當(dāng)時(shí)占用cpu高的模塊，是在請(qǐng)求的時(shí)候才會(huì)走的邏輯步脓。不太可能是upstram后端拖住nginx愿待，從而觸發(fā)這個(gè)cpu的耗時(shí)操作浩螺。

10.5.2 解決方式

遇到這種問題，我們優(yōu)先解決已知的仍侥，并且非常明確的問題要出。那就是cpu高的問題。解決方式先降級(jí)關(guān)閉占用cpu過高的模塊农渊，然后進(jìn)行觀察患蹂。經(jīng)過降級(jí)關(guān)閉該模塊cpu降下來了，并且nginx請(qǐng)求流量也正常了砸紊。之所以會(huì)影響upstream時(shí)間拉長传于，因?yàn)閡pstream后端的服務(wù)調(diào)用的接口可能是個(gè)環(huán)路再次走回到nginx。

11. 參考資料

http://www.brendangregg.com/index.html
http://www.brendangregg.com/FlameGraphs/cpuflamegraphs.html
http://www.brendangregg.com/FlameGraphs/memoryflamegraphs.html
http://www.brendangregg.com/FlameGraphs/offcpuflamegraphs.html
http://www.brendangregg.com/blog/2014-11-09/differential-flame-graphs.html
https://github.com/openresty/openresty-systemtap-toolkit
https://github.com/brendangregg/FlameGraph
https://www.slideshare.net/brendangregg/blazing-performance-with-flame-graphs

最后編輯于：2020.03.09 15:23:27

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末醉顽，一起剝皮案震驚了整個(gè)濱河市沼溜，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌游添，老刑警劉巖系草，帶你破解...
沈念sama閱讀 216,496評(píng)論 6贊 501
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異否淤，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)棠隐，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,407評(píng)論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門石抡，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人助泽，你說我怎么就攤上這事啰扛。” “怎么了嗡贺？”我有些...
開封第一講書人閱讀 162,632評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵隐解，是天一觀的道長。經(jīng)常有香客問我诫睬，道長煞茫，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,180評(píng)論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任摄凡，我火速辦了婚禮续徽，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘亲澡。我一直安慰自己钦扭，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,198評(píng)論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布床绪。她就那樣靜靜地躺著客情，像睡著了一般其弊。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上膀斋，一...
開封第一講書人閱讀 51,165評(píng)論 1贊 299
城市分裂傳說
那天梭伐，我揣著相機(jī)與錄音，去河邊找鬼概页。笑死籽御，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的惰匙。我是一名探鬼主播技掏，決...
沈念sama閱讀 40,052評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼项鬼！你這毒婦竟也來了哑梳？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 38,910評(píng)論 0贊 274
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤绘盟，失蹤者是張志新（化名）和其女友劉穎鸠真，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體龄毡，經(jīng)...
沈念sama閱讀 45,324評(píng)論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡吠卷，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,542評(píng)論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了沦零。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片祭隔。...
茶點(diǎn)故事閱讀 39,711評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖路操，靈堂內(nèi)的尸體忽然破棺而出疾渴，到底是詐尸還是另有隱情，我是刑警寧澤屯仗，帶...
沈念sama閱讀 35,424評(píng)論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布搞坝，位于F島的核電站，受9級(jí)特大地震影響魁袜，放射性物質(zhì)發(fā)生泄漏桩撮。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,017評(píng)論 3贊 326
男人毒藥：我在死后第九天來索命
文/蒙蒙一峰弹、第九天我趴在偏房一處隱蔽的房頂上張望距境。院中可真熱鬧，春花似錦垮卓、人聲如沸垫桂。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,668評(píng)論 0贊 22
一樁弒父案粟按，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽诬滩。三九已至霹粥，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間疼鸟，已是汗流浹背后控。一陣腳步聲響...
開封第一講書人閱讀 32,823評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留空镜，地道東北人浩淘。一個(gè)月前我還...
沈念sama閱讀 47,722評(píng)論 2贊 368
代替公主和親
正文我出身青樓，卻偏偏與公主長得像吴攒，于是被迫代替她去往敵國和親张抄。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,611評(píng)論 2贊 353

接入層問題故障定位

1. 背景

2. 說明

3. 分析問題的方法論

4. cpu

4.1 說明

4.2 分析工具

4.3 使用方式

5. 內(nèi)存

5.1 說明

5.2 分析工具

5.3 使用方式

6. 磁盤IO

6.1 說明

6.2 分析工具

6.3 使用方式

7. 網(wǎng)絡(luò)

7.1 說明

7.2 分析工具

7.3 使用方式

8. 系統(tǒng)負(fù)載

8.1 說明

8.2 分析工具

8.3使用方式

9. 火焰圖

9.1 說明

9.2 安裝依賴庫

9.3 安裝

9.4 CPU級(jí)別火焰圖

9.4.1 on-CPU

9.4.2 off-CPU

9.5 內(nèi)存級(jí)別火焰圖

9.6 性能回退-紅藍(lán)差分火焰圖

10. 案例分析

10.1 接入層nginx集群異彻┝叮現(xiàn)象

10.2 分析nginx相關(guān)指標(biāo)

10.3 分析系統(tǒng)cpu情況

10.4 火焰圖分析cpu

10.5 案例總結(jié)

10.5.1 深入分析

10.5.2 解決方式

11. 參考資料

推薦閱讀更多精彩內(nèi)容