文章每周持續(xù)更新吃谣,各位的「三連」是對(duì)我最大的肯定乞封。可以微信搜索公眾號(hào)「 后端技術(shù)學(xué)堂 」第一時(shí)間閱讀(一般比博客早更新一到兩篇)
操作系統(tǒng)「進(jìn)程」是學(xué)計(jì)算機(jī)都要接觸的基本概念岗憋,拋開那些純理論的操作系統(tǒng)底層實(shí)現(xiàn)肃晚,在Linux下做軟件開發(fā)這么多年,每次程序運(yùn)行出現(xiàn)問題澜驮,都要一步一步分析進(jìn)程各種狀態(tài)陷揪,去排查問題出在哪里,這次lemon帶你在Linux環(huán)境下實(shí)操杂穷,一步步探究揭開「Linux進(jìn)程」的那些秘密悍缠。
何為進(jìn)程
首先我們說下「程序」的概念,程序是一些保存在磁盤上的指令的有序集合耐量,是靜態(tài)的飞蚓。進(jìn)程是程序執(zhí)行的過程,包括了動(dòng)態(tài)創(chuàng)建廊蜒、調(diào)度和消亡的整個(gè)過程趴拧,它是程序資源管理的最小單位。
線程是操作操作系統(tǒng)能夠進(jìn)行運(yùn)算調(diào)度的最小單位山叮。大部分情況下著榴,它被包含在進(jìn)程之中,是進(jìn)程中的實(shí)際運(yùn)作單位屁倔,一個(gè)進(jìn)程內(nèi)可以包含多個(gè)線程脑又,是資源調(diào)度的最小單位。「引用維基百科」
探究進(jìn)程第一步问麸,你在嗎往衷?還好嗎?
ps
report a snapshot of the current processes.
列出當(dāng)前系統(tǒng)進(jìn)程的快照严卖。
找到進(jìn)程PID ( Process IDentity )席舍,pid唯一標(biāo)識(shí)一個(gè)進(jìn)程。用ps
這個(gè)命令哮笆,這個(gè)命令大家應(yīng)該都知道吧来颤,對(duì)于小白用戶,首先他不是Photoshop疟呐。
給大家簡單介紹一下脚曾,一般用法是ps -ef
列出系統(tǒng)內(nèi)經(jīng)常信息东且,通常都會(huì)帶管道grep
出自己感興趣的進(jìn)程启具,像這樣ps -ef|grep intresting
第一列PID代表進(jìn)程號(hào),PPID(parent process ID)代表父進(jìn)程號(hào)珊泳。
探究進(jìn)程第二步鲁冯,讓我看看你都交了哪些朋友(系統(tǒng)調(diào)用 & 信號(hào))
strace
strace - trace system calls and signals
跟蹤進(jìn)程內(nèi)部的系統(tǒng)調(diào)用和信號(hào)
什么是「系統(tǒng)調(diào)用」?系統(tǒng)調(diào)用(system call)色查,指運(yùn)行在「用戶態(tài)」的程序向操作系統(tǒng)「內(nèi)核態(tài)」請(qǐng)求需要更高權(quán)限運(yùn)行的服務(wù)薯演,系統(tǒng)調(diào)用提供用戶程序與操作系統(tǒng)之間的接口。
strace
后面跟著啟動(dòng)一個(gè)進(jìn)程秧了,可以跟蹤啟動(dòng)后進(jìn)程的系統(tǒng)調(diào)用和信號(hào)跨扮,這個(gè)命令可以看到進(jìn)程執(zhí)行時(shí)候都調(diào)用了哪些系統(tǒng)調(diào)用,通過指定不同的選項(xiàng)可以輸出系統(tǒng)調(diào)用發(fā)生的時(shí)間验毡,精度可以精確到微秒衡创,甚至還可以統(tǒng)計(jì)分析系統(tǒng)「調(diào)用的耗時(shí)」,這在排查進(jìn)程假死問題的時(shí)候很有用晶通,能幫你發(fā)現(xiàn)進(jìn)程卡在哪個(gè)系統(tǒng)調(diào)用上璃氢。已經(jīng)在運(yùn)行的進(jìn)程也可以指定-p
參數(shù)加pid
像gdb attach
那樣附著上去跟蹤。
探究進(jìn)程第三步狮辽,讓我看看你帶的小弟們(線程)一也。
pstack
print a stack trace of a running process
打印出運(yùn)行中程序的堆棧信息。
執(zhí)行命令pstack pid
你能看到當(dāng)前線程運(yùn)行中的堆棧信息喉脖,其中的pid可用之前的ps
命令獲得椰苟,pstack
可以看到進(jìn)程內(nèi)啟動(dòng)的線程號(hào),每個(gè)進(jìn)程內(nèi)線程的「堆検鬟矗」內(nèi)容也能看到舆蝴。
看到上面打印出的LWP了嗎,這里是個(gè)知識(shí)點(diǎn), LPW是指Light-weight process
輕量級(jí)線程须误。引申知識(shí):
- Linux中沒有真正的線程
- Linux中沒有的線程
Thread
是由進(jìn)程來模擬實(shí)現(xiàn)的所以稱作:輕量級(jí)進(jìn)程- 進(jìn)程是「資源管理」的最小單元挨稿,線程是「資源調(diào)度」的最小單元(這里不考慮協(xié)程)
探究進(jìn)程第四步,讓小弟們(線程)出來排個(gè)隊(duì)吧京痢。
pstree
pstree - display a tree of processes
pstree按樹形結(jié)構(gòu)打印運(yùn)行中進(jìn)程結(jié)構(gòu)信息
可以直觀的查看進(jìn)程和它啟動(dòng)的線程的關(guān)系奶甘,并能顯示進(jìn)程標(biāo)識(shí)。
探究進(jìn)程第五步祭椰,是死(進(jìn)程崩潰)是活(進(jìn)程運(yùn)行中)我都要知道你的秘密(堆棧幀 & 上下文)臭家。
gdb
gdb是GNU開發(fā)的gcc套件中Linux下程序調(diào)試工具,你可以查看程序的堆棧方淤、設(shè)置斷點(diǎn)钉赁、打印程序運(yùn)行時(shí)信息,甚至還能調(diào)試多線程程序携茂,功能十分強(qiáng)大你踩。
在這里把gdb當(dāng)成一個(gè)命令來講有點(diǎn)大材小用,要詳細(xì)說gdb的話讳苦,完全可以撐起一篇文章的篇幅带膜,這里長話短說,有機(jī)會(huì)再開一篇文章詳細(xì)介紹下它鸳谜。
使用
要用gdb調(diào)試C/C++程序首先編譯的時(shí)候要加-g
選項(xiàng)膝藕,g++ -g test.cpp -o test
這樣生成的程序就可以用gdb來調(diào)試?yán)病?/p>
- 可以直接用gdb啟動(dòng)程序調(diào)試,命令:
gdb prog
- 用gdb附著到一個(gè)已經(jīng)啟動(dòng)的進(jìn)程上調(diào)試也可以咐扭。命令:
gdb prog pid
- 程序崩潰之后參數(shù)corefile也可以用gdb調(diào)試芭挽,看看程序死掉之前留了什么遺言(堆棧信息)給你。命令:
gdb prog corefile
蝗肪,這里有一點(diǎn)需要注意袜爪,有些Linux系統(tǒng)默認(rèn)程序崩潰不生成corefile
,這時(shí)你需要ulimit -c unlimited
這樣就能生成corefile
了穗慕。
gdb調(diào)試
探究進(jìn)程第六步饿敲,關(guān)于你的所有,我都想知道逛绵。
更近一步
通過/proc/pid
文件了解進(jìn)程的運(yùn)行時(shí)信息和統(tǒng)計(jì)信息怀各。/proc
系統(tǒng)是一個(gè)偽文件系統(tǒng),它只存在內(nèi)存當(dāng)中术浪,而不占用外存空間瓢对,以文件系統(tǒng)的方式為內(nèi)核與進(jìn)程提供通信的接口。進(jìn)入系統(tǒng)/proc
目錄:
/proc目錄下有很多以數(shù)字命名的目錄胰苏,每個(gè)數(shù)字代表進(jìn)程號(hào)PID它們是進(jìn)程目錄硕蛹。系統(tǒng)中當(dāng)前運(yùn)行的每一個(gè)進(jìn)程在/proc下都對(duì)應(yīng)一個(gè)以進(jìn)程號(hào)為目錄名的目錄/proc/pid
,它們是讀取進(jìn)程信息的接口,我們可以進(jìn)到這個(gè)文件里面法焰,了解進(jìn)程的運(yùn)行時(shí)信息和統(tǒng)計(jì)信息秧荆。
高頻使用
/proc/pid
目錄下的有一些重要文件,挑幾個(gè)使用頻率高的講一講埃仪。
/proc/pid/environ
包含了進(jìn)程的可用環(huán)境變量的列表 乙濒。程序出問題了如果不確定環(huán)境變量是否設(shè)置生效,可以cat
這個(gè)文件出來查看確認(rèn)一下卵蛉。
/proc/pid/fd/
這個(gè)目錄包含了進(jìn)程打開的每一個(gè)文件的鏈接颁股。從這里可以查看進(jìn)程打開的文件描述符信息,包括標(biāo)準(zhǔn)輸入傻丝、輸出甘有、錯(cuò)誤流,進(jìn)程打開的socket
連接文件描述符也能看到葡缰,lsof
命令也有類似的作用亏掀。
/proc/pid/stat
包含了進(jìn)程的所有狀態(tài)信息,進(jìn)程號(hào)运准、父進(jìn)程號(hào)幌氮、 線程組號(hào)缭受、 該任務(wù)在用戶態(tài)運(yùn)行的時(shí)間 胁澳、 該任務(wù)在用內(nèi)核態(tài)運(yùn)行的時(shí)間、 虛擬地址空間的代碼段米者、 阻塞信號(hào)的位圖等等信息應(yīng)有盡有韭畸。
其他統(tǒng)計(jì)
/proc/pid/cmdline
包含了用于開始進(jìn)程的命令
/proc/pid/cwd
包含了當(dāng)前進(jìn)程工作目錄的一個(gè)鏈接
/proc/pid/exe
包含了正在進(jìn)程中運(yùn)行的程序鏈接
/proc/pid/mem
包含了進(jìn)程在內(nèi)存中的內(nèi)容
/proc/pid/statm
包含了進(jìn)程的內(nèi)存使用信息
好了,一頓操作下來蔓搞,你對(duì)進(jìn)程和它背后的秘密你已經(jīng)非常了解了胰丁,下次我們的好朋友「進(jìn)程」如果遇到了什么問題(崩潰coredump
、假死喂分、阻塞锦庸、系統(tǒng)調(diào)用超時(shí)、文件描述符異常)蒲祈,你應(yīng)該知道如何幫它處理了吧甘萧!我們來總結(jié)一下:
- ps查看進(jìn)程id,看看進(jìn)程還在不在以及進(jìn)程狀態(tài)
- 如果在的話
strace
梆掸、psstack
看下進(jìn)程當(dāng)前信息扬卷,是不卡死在哪個(gè)位置,對(duì)比各幀最后調(diào)用信息找到異常點(diǎn) - 如果進(jìn)程不再了酸钦,如果有
corefile
文件怪得,直接上gdb
查看corefile
信息 - 其他疑難雜癥懷疑進(jìn)程狀態(tài)信息的時(shí)候,看看
/proc/pid
下面的進(jìn)程狀態(tài)信息,可能會(huì)給你啟發(fā)徒恋。 - 最后蚕断,如果以上都不行,閉目祈禱吧入挣!
寫在最后
今天的分享希望對(duì)你有幫助基括,祝大家寫的服務(wù)永不宕機(jī),從不coredump财岔,讓上面教你的操作吃灰去吧风皿。
最后,感謝各位的閱讀匠璧。文章的目的是分享對(duì)知識(shí)的理解桐款,技術(shù)類文章我都會(huì)反復(fù)求證以求最大程度保證準(zhǔn)確性,若文中出現(xiàn)明顯紕漏也歡迎指出夷恍,我們一起在探討中學(xué)習(xí)魔眨。
可以微信搜索公眾號(hào)「 后端技術(shù)學(xué)堂 」回復(fù)「資料」有我給你準(zhǔn)備的各種編程學(xué)習(xí)資料。文章每周持續(xù)更新酿雪,我們下期見遏暴!
reference
https://blog.csdn.net/dan15188387481/article/details/49450491