supervisor 進(jìn)程管理

Supervisor (http://supervisord.org) 是一個(gè)用 [Python] 寫的進(jìn)程管理工具谴仙,可以很方便的用來啟動(dòng)券盅、重啟苟呐、關(guān)閉進(jìn)程(不僅僅是 Python 進(jìn)程)镶骗。除了對單個(gè)進(jìn)程的控制包竹,還可以同時(shí)啟動(dòng)、關(guān)閉多個(gè)進(jìn)程查库,比如很不幸的服務(wù)器出問題導(dǎo)致所有應(yīng)用程序都被殺死路媚,此時(shí)可以用 supervisor 同時(shí)啟動(dòng)所有應(yīng)用程序而不是一個(gè)一個(gè)地敲命令啟動(dòng)。

安裝

當(dāng)前Supervisor的最高版本是3.0樊销,之前嘗試使用2.x版本管理實(shí)驗(yàn)集群中的若干mdrill進(jìn)程整慎,發(fā)現(xiàn)使用客戶端無法有效啟動(dòng)和停止服務(wù)器端管理的各個(gè)子進(jìn)程脏款,從網(wǎng)上搜索錯(cuò)誤發(fā)現(xiàn)2.x版本有一些bug,建議升級到3.0版本裤园。因此我卸載了2.x版本撤师,重新安裝了3.0版本,發(fā)現(xiàn)3.0版本很好使拧揽。3.0版本相對2.x版本剃盾,配置文件不同部分的配置項(xiàng)都發(fā)生了變化,詳見官方文檔淤袜。

sudo yum install python-setuptools-devel
easy_install supervisor 或 sudo pip install supervisor

如果是 Ubuntu 系統(tǒng)痒谴,還可以使用 apt-get 安裝

apt-get install supervisor

supervisord 配置

Supervisor 相當(dāng)強(qiáng)大,提供了很豐富的功能铡羡,不過我們可能只需要用到其中一小部分积蔚。安裝完成之后,可以編寫配置文件烦周,來滿足自己的需求尽爆。為了方便,我們把配置分成兩部分:supervisord(supervisor 是一個(gè) C/S 模型的程序读慎,這是 server 端漱贱,對應(yīng)的有 client 端:supervisorctl)和應(yīng)用程序(即我們要管理的程序)。
首先來看 supervisord 的配置文件贪壳。安裝完 supervisor 之后饱亿,可以運(yùn)行echo_supervisord_conf
命令輸出默認(rèn)的配置項(xiàng),也可以重定向到一個(gè)配置文件里:

echo_supervisord_conf > /etc/supervisord.conf

去除里面大部分注釋和“不相關(guān)”的部分闰靴,注釋符號為分號,我們可以先看這些配置:

[unix_http_server]
file=/tmp/supervisor.sock   ; UNIX socket 文件钻注,supervisorctl 會(huì)使用
;chmod=0700                 ; socket 文件的 mode蚂且,默認(rèn)是 0700
;chown=nobody:nogroup       ; socket 文件的 owner,格式: uid:gid
 
;[inet_http_server]         ; HTTP 服務(wù)器幅恋,提供 web 管理界面
;port=127.0.0.1:9001        ; Web 管理后臺(tái)運(yùn)行的 IP 和端口杏死,如果開放到公網(wǎng),需要注意安全性
;username=user              ; 登錄管理后臺(tái)的用戶名
;password=123               ; 登錄管理后臺(tái)的密碼
 
[supervisord]
logfile=/tmp/supervisord.log ; 日志文件捆交,默認(rèn)是 $CWD/supervisord.log
logfile_maxbytes=50MB        ; 日志文件大小淑翼,超出會(huì) rotate,默認(rèn) 50MB
logfile_backups=10           ; 日志文件保留備份數(shù)量默認(rèn) 10
loglevel=info                ; 日志級別品追,默認(rèn) info玄括,其它: debug,warn,trace
pidfile=/tmp/supervisord.pid ; pid 文件
nodaemon=false               ; 是否在前臺(tái)啟動(dòng),默認(rèn)是 false肉瓦,即以 daemon 的方式啟動(dòng)
minfds=1024                  ; 可以打開的文件描述符的最小值遭京,默認(rèn) 1024
minprocs=200                 ; 可以打開的進(jìn)程數(shù)的最小值胃惜,默認(rèn) 200
 
; the below section must remain in the config file for RPC
; (supervisorctl/web interface) to work, additional interfaces may be
; added by defining them in separate rpcinterface: sections
[rpcinterface:supervisor]
supervisor.rpcinterface_factory = supervisor.rpcinterface:make_main_rpcinterface
 
[supervisorctl]
serverurl=unix:///tmp/supervisor.sock ; 通過 UNIX socket 連接 supervisord,路徑與 unix_http_server 部分的 file 一致
;serverurl=http://127.0.0.1:9001 ; 通過 HTTP 的方式連接 supervisord
 
; 包含其他的配置文件
[include]
files = relative/directory/*.ini    ; 可以是 *.conf 或 *.ini

我們把上面這部分配置保存到 /etc/supervisord.conf(或其他任意有權(quán)限訪問的文件)哪雕,然后啟動(dòng) supervisord(通過 -c 選項(xiàng)指定配置文件路徑船殉,如果不指定會(huì)按照這個(gè)順序查找配置文件:$CWD/supervisord.conf, $CWD/etc/supervisord.conf, /etc/supervisord.conf):

supervisord -c /etc/supervisord.conf   或  supervisord 

program 配置

上面我們已經(jīng)把 supervisrod 運(yùn)行起來了,現(xiàn)在可以添加我們要管理的進(jìn)程的配置文件斯嚎±妫可以把所有配置項(xiàng)都寫到 supervisord.conf 文件里,但并不推薦這樣做堡僻,而是通過 include 的方式把不同的程序(組)寫到不同的配置文件里糠惫。
為了舉例,我們新建一個(gè)目錄 /etc/supervisor/ 用于存放這些配置文件苦始,相應(yīng)的寞钥,把 /etc/supervisord.conf 里 include 部分的的配置修改一下,支持自定義路徑:

[include]
files = /etc/supervisor/*.conf

現(xiàn)在編寫一份配置文件來管理這個(gè)進(jìn)程陌选,自定義栗子如下:

[program:flume]
directory = /export/flume/apache-flume-1.6.0-bin/
command = nohup bin/flume-ng agent -c conf -f conf/flume.conf -n agent -Dflume.root.logger=INFO,console > /dev/null 2>&1 &
autostart = true
startsecs = 5
autorestart = true
startretries = 3
user = root
redirect_stderr = true
stdout_logfile_maxbytes = 20MB
stdout_logfile_backups = 10
stdout_logfile = /export/flume/logs/sup_flume_stdout.log
;IT will stop all processes including child process
stopasgroup=true

栗子如下:

[program:usercenter]
directory = /home/leon/projects/usercenter       ; 程序的啟動(dòng)目錄
command = gunicorn -c gunicorn.py wsgi:app         ; 啟動(dòng)命令理郑,可以看出與手動(dòng)在命令行啟動(dòng)的命令是一樣的
process_name=%(program_name)s       ; process_name expr (default %(program_name)s)
numprocs=1           ; number of processes copies to start (def 1)
autostart = true     ; 在 supervisord 啟動(dòng)的時(shí)候也自動(dòng)啟動(dòng)
startsecs = 1        ; 啟動(dòng) 1 秒后沒有異常退出,就當(dāng)作已經(jīng)正常啟動(dòng)了
autorestart = true   ; 程序異常退出后自動(dòng)重啟
startretries = 3     ; 啟動(dòng)失敗自動(dòng)重試次數(shù)咨油,默認(rèn)是 3
user = leon          ; 用哪個(gè)用戶啟動(dòng)
redirect_stderr = true          ; 把 stderr 重定向到 stdout您炉,默認(rèn) false
stdout_logfile_maxbytes = 20MB  ; stdout 日志文件大小,默認(rèn) 50MB
stdout_logfile_backups = 10     ; stdout 日志文件備份數(shù)
; stdout 日志文件役电,需要注意當(dāng)指定目錄不存在時(shí)無法正常啟動(dòng)赚爵,所以需要手動(dòng)創(chuàng)建目錄(supervisord 會(huì)自動(dòng)創(chuàng)建日志文件)
stdout_logfile = /data/logs/usercenter_stdout.log
;這一配置項(xiàng)的作用是:如果supervisord管理的進(jìn)程px又產(chǎn)生了若干子進(jìn)程,使用supervisorctl停止px進(jìn)程法瑟,停止信號會(huì)傳播給px產(chǎn)生的所有子進(jìn)程冀膝,確保子進(jìn)程也一起停止。這一配置項(xiàng)對希望停止所有進(jìn)程的需求是非常有用的霎挟。
stopasgroup=true
 
; 可以通過 environment 來添加需要的環(huán)境變量窝剖,一種常見的用法是修改PYTHONPATH ;process environment additions      
; environment=PYTHONPATH=$PYTHONPATH:/path/to/somewhere  

有幾個(gè)配置項(xiàng)值得解釋一下,可以根據(jù)需要自行設(shè)置酥夭。

  1. stopasgroup=true赐纱。這一配置項(xiàng)的作用是:如果supervisord管理的進(jìn)程px又產(chǎn)生了若干子進(jìn)程,使用supervisorctl停止px進(jìn)程熬北,停止信號會(huì)傳播給px產(chǎn)生的所有子進(jìn)程疙描,確保子進(jìn)程也一起停止。這一配置項(xiàng)對希望停止所有進(jìn)程的需求是非常有用的讶隐。
  2. autostart=true起胰。這一配置項(xiàng)的作用是:當(dāng)啟動(dòng)supervisord的時(shí)候會(huì)將該配置項(xiàng)設(shè)置為true的所有進(jìn)程自動(dòng)啟動(dòng)。
  3. 一份配置文件至少需要一個(gè) [program:x]部分的配置整份,來告訴 supervisord 需要管理那個(gè)進(jìn)程待错。[program:x]語法中的 x 表示 program name籽孙,會(huì)在客戶端(supervisorctl 或 web 界面)顯示,在 supervisorctl 中通過這個(gè)值來對程序進(jìn)行 start火俄、restart犯建、stop 等操作。

啟動(dòng)supervisor進(jìn)程后瓜客,可以配置通過web界面查看适瓦,效果如下:

效果圖

確保配置無誤后可以在每臺(tái)主機(jī)上使用下面的命令啟動(dòng)supervisor的服務(wù)器端supervisord
【啟動(dòng)supervisord】

supervisord -c /etc/supervisord.conf   或  supervisord 

【停止supervisord】

supervisorctl shutdown

【重新加載配置文件】

supervisorctl reload

【進(jìn)程管理】

  1. 啟動(dòng)supervisord管理的所有進(jìn)程
supervisorctl start all
  1. 停止supervisord管理的所有進(jìn)程
supervisorctl stop all
  1. 啟動(dòng)supervisord管理的某一個(gè)特定進(jìn)程
supervisorctl start program-name // program-name為[program:xx]中的xx
  1. 停止supervisord管理的某一個(gè)特定進(jìn)程
supervisorctl stop program-name  // program-name為[program:xx]中的xx
  1. 重啟所有進(jìn)程或所有進(jìn)程
supervisorctl restart all // 重啟所有supervisorctl reatart program-name // 重啟某一進(jìn)程,program-name為[program:xx]中的xx
  1. 查看supervisord當(dāng)前管理的所有進(jìn)程的狀態(tài)
supervisorctl status

使用 supervisorctl 客戶端命令

Supervisorctl 是 supervisord 的一個(gè)命令行客戶端工具谱仪,啟動(dòng)時(shí)需要指定與 supervisord 使用同一份配置文件玻熙,否則與 supervisord 一樣按照順序查找配置文件

supervisorctl -c /etc/supervisord.conf

上面這個(gè)命令會(huì)進(jìn)入 supervisorctl 的 shell 界面,然后可以執(zhí)行不同的命令了:

> status    # 查看程序狀態(tài)
> stop usercenter   # 關(guān)閉 usercenter 程序
> start usercenter  # 啟動(dòng) usercenter 程序
> restart usercenter    # 重啟 usercenter 程序
> reread    # 讀取有更新(增加)的配置文件疯攒,不會(huì)啟動(dòng)新添加的程序
> update    # 重啟配置文件修改過的程序

上面這些命令都有相應(yīng)的輸出嗦随,除了進(jìn)入 supervisorctl 的 shell 界面,等同于直接在 bash 終端運(yùn)行:

$ supervisorctl status
$ supervisorctl stop usercenter
$ supervisorctl start usercenter
$ supervisorctl restart usercenter
$ supervisorctl reread
$ supervisorctl update

【其他】

除了 supervisorctl 之外敬尺,還可以配置 supervisrod 啟動(dòng) web 管理界面枚尼,這個(gè) web 后臺(tái)使用 Basic Auth 的方式進(jìn)行身份認(rèn)證。
除了單個(gè)進(jìn)程的控制砂吞,還可以配置 group署恍,進(jìn)行分組管理。
經(jīng)常查看日志文件蜻直,包括 supervisord 的日志和各個(gè) pragram 的日志文件盯质,程序 crash 或拋出異常的信息一半會(huì)輸出到 stderr,可以查看相應(yīng)的日志文件來查找問題概而。

  • 遇到問題及解決方案

在使用命令supervisorctl start all啟動(dòng)控制進(jìn)程時(shí)呼巷,遇到如下錯(cuò)誤

unix:///tmp/supervisor.sock no such file

出現(xiàn)上述錯(cuò)誤的原因是supervisord并未啟動(dòng),只要在命令行中使用命令sudo supervisord啟動(dòng)supervisord即可赎瑰。

  • 遺留問題

當(dāng)集群規(guī)模擴(kuò)大后朵逝,登錄到每臺(tái)主機(jī)使用supervior控制進(jìn)程也是很麻煩的,能不能用一臺(tái)主機(jī)作為客戶端乡范,同時(shí)連接集群中的所有主機(jī),以一種中心化的方式統(tǒng)一管理集群中的所有進(jìn)程啤咽?之前一直使用的方式是使用交互式工具expect晋辆。supervisor本身有沒有提供一種機(jī)制實(shí)現(xiàn)集群中所有進(jìn)程的中央化管理?

目前測試成功的是使用一臺(tái)主機(jī)作為客戶端(supervisorctl)宇整,控制另一臺(tái)服務(wù)器(supervisord)主機(jī)上的狀態(tài)瓶佳。方法是在服務(wù)器端配置[inet_http_server]部分,開啟TCP端口監(jiān)聽鳞青“运牵客戶端配置[supervisorctl]部分为朋,指定服務(wù)器端的serverurl,連接服務(wù)器端監(jiān)聽的端口厚脉。但是一個(gè)客戶端只能連接一個(gè)服務(wù)器习寸,無法指定多個(gè)服務(wù)器。

Supervisor 有很豐富的功能傻工,還有其他很多項(xiàng)配置霞溪,可以在官方文檔獲取更多信息:http://supervisord.org/index.html
參考資料

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市中捆,隨后出現(xiàn)的幾起案子鸯匹,更是在濱河造成了極大的恐慌,老刑警劉巖泄伪,帶你破解...
    沈念sama閱讀 216,496評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件殴蓬,死亡現(xiàn)場離奇詭異,居然都是意外死亡蟋滴,警方通過查閱死者的電腦和手機(jī)染厅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來脓杉,“玉大人糟秘,你說我怎么就攤上這事∏蛏ⅲ” “怎么了蛛砰?”我有些...
    開封第一講書人閱讀 162,632評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長茴厉。 經(jīng)常有香客問我搁骑,道長,這世上最難降的妖魔是什么屋讶? 我笑而不...
    開封第一講書人閱讀 58,180評論 1 292
  • 正文 為了忘掉前任冰寻,我火速辦了婚禮,結(jié)果婚禮上皿渗,老公的妹妹穿的比我還像新娘斩芭。我一直安慰自己,他們只是感情好乐疆,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,198評論 6 388
  • 文/花漫 我一把揭開白布划乖。 她就那樣靜靜地躺著,像睡著了一般挤土。 火紅的嫁衣襯著肌膚如雪琴庵。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,165評論 1 299
  • 那天,我揣著相機(jī)與錄音迷殿,去河邊找鬼儿礼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛庆寺,可吹牛的內(nèi)容都是我干的蚊夫。 我是一名探鬼主播,決...
    沈念sama閱讀 40,052評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼屈扎!你這毒婦竟也來了鹰晨?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,910評論 0 274
  • 序言:老撾萬榮一對情侶失蹤止毕,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后扁凛,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體忍疾,經(jīng)...
    沈念sama閱讀 45,324評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,542評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片士复。...
    茶點(diǎn)故事閱讀 39,711評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情魂毁,我是刑警寧澤出嘹,帶...
    沈念sama閱讀 35,424評論 5 343
  • 正文 年R本政府宣布郎仆,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏盗舰。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,017評論 3 326
  • 文/蒙蒙 一蛮位、第九天 我趴在偏房一處隱蔽的房頂上張望猾昆。 院中可真熱鬧,春花似錦烘苹、人聲如沸镣衡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,668評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽丰滑。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,823評論 1 269
  • 我被黑心中介騙來泰國打工涨享, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留吁讨,地道東北人波势。 一個(gè)月前我還...
    沈念sama閱讀 47,722評論 2 368
  • 正文 我出身青樓挣郭,卻偏偏與公主長得像侄非,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,611評論 2 353

推薦閱讀更多精彩內(nèi)容