我們經(jīng)常會碰到這樣的問題等浊,用telnet/ssh 登錄了遠程的 Linux 服務(wù)器,運行了一些耗時較長的任務(wù)摹蘑, 結(jié)果卻由于網(wǎng)絡(luò)的不穩(wěn)定導(dǎo)致任務(wù)中途失敗筹燕。如何讓命令提交后不受本地關(guān)閉終端窗口/網(wǎng)絡(luò)斷開連接的干擾呢?下面舉了一些例子, 您可以針對不同的場景選擇不同的方式來處理這個問題撒踪。
我們知道过咬,當用戶注銷(logout)或者網(wǎng)絡(luò)斷開時,運行當前進程的父進程市當前shell終端進程制妄,關(guān)閉當前shell終端時候掸绞,父進程退出,會發(fā)送hangup信號給所有子進程耕捞,從而關(guān)閉其所有子進程衔掸。因此,我們的解決辦法就有兩種途徑:要么讓進程忽略HUP 信號俺抽,要么讓進程運行在新的會話里從而成為不屬于此終端的子進程敞映。
1. nohup
nohup 無疑是我們首先想到的辦法。顧名思義磷斧,nohup 的用途就是讓提交的命令忽略 hangup 信號振愿。讓我們先來看一下 nohup 的幫助信息:
NOHUP(1) ???? User Commands ???????? NOHUP(1)
NAME
? ? ? nohup - run a command immune to hangups, with output to a non-tty
SYNOPSIS
? ? ? nohup COMMAND [ARG]...
? ? ? nohup OPTION
DESCRIPTION
? ? ? Run COMMAND, ignoring hangup signals.
? ? ? --help display this help and exit
? ? ? --version
? ? ? ? ? ? ? output version information and exit
可見,nohup 的使用是十分方便的瞳抓,只需在要處理的命令前加上 nohup 即可埃疫,標準輸出和標準錯誤缺省會被重定向到 nohup.out 文件中。一般我們可在結(jié)尾加上"&"來將命令同時放入后臺運行孩哑,也可用">filename?2>&1"來更改缺省的重定向文件名栓霜。
nohup 示例
????1. 不中斷的在后臺運行test.sh:nohup ./test.sh &(test.sh的打印信息會輸出到當前目錄下的nohup.out中)
????2. 使用jobs可看到test.sh處于running狀態(tài)
????3. 使用ps -ef |grep test.sh可查看到正在運行的test.sh腳本進程
????????[root@pvcent107 ~]# ps -ef |grep 3059
????????root????? 3059?? 984? 0 21:06 pts/3??? 00:00:00 test.sh
????????root????? 3067?? 984? 0 21:06 pts/3??? 00:00:00 grep 3059
????????[root@pvcent107 ~]#
4. 退出當前shell終端,再重新打開横蜒,使用jobs看不到正在運行的test.sh胳蛮,但使用ps -ef可以看到在后臺不中斷的運行test.sh,可以使用nohup忽略hangup信號丛晌,或者使用setsid將其父進程改為init進程(進程號為1)
2. setsid
nohup 無疑能通過忽略 HUP 信號來使我們的進程避免中途被中斷仅炊,但如果我們換個角度思考,如果我們的進程不屬于接受 HUP 信號的終端的子進程澎蛛,那么自然也就不會受到 HUP 信號的影響了抚垄。setsid 就能幫助我們做到這一點,將當前進程的父進程改為init進程(進程號是1)谋逻。讓我們先來看一下setsid 的幫助信息:
SETSID(8)???????????????? Linux Programmer’s Manual???????????????? SETSID(8)
NAME
???????setsid - run a program in a new session
SYNOPSIS
???????setsid program [ arg ... ]
DESCRIPTION
???????setsid runs a program in a new session.
可見setsid 的使用也是非常方便的呆馁,也只需在要處理的命令前加上 setsid 即可。
setsid 示例
[root@pvcent107 ~]# setsid test.sh.com
[root@pvcent107 ~]# ps -ef |grep tests.sh
root???? 31094???? 1? 0 07:28 ???????? 00:00:00 test.sh
root???? 31102 29217? 0 07:29 pts/4??? 00:00:00 grep test.sh
[root@pvcent107 ~]#
值得注意的是毁兆,上例中我們的進程ID(PID)為31094浙滤,而它的父 ID(PPID)為1(即為 init 進程 ID),并不是當前終端的進程 ID气堕。請將此例與nohup 例中的父ID 做比較纺腊。
3畔咧。&
這里還有一個關(guān)于subshell 的小技巧。我們知道揖膜,將一個或多個命名包含在“()”中就能讓這些命令在子 shell 中運行中誓沸,從而擴展出很多有趣的功能,我們現(xiàn)在要討論的就是其中之一壹粟。
當我們將"&"也放入“()”內(nèi)之后蔽介,我們就會發(fā)現(xiàn)所提交的作業(yè)并不在作業(yè)列表中,也就是說煮寡,是無法通過jobs來查看的。讓我們來看看為什么這樣就能躲過HUP 信號的影響吧犀呼。
subshell 示例
[root@pvcent107 ~]# (ping www.ibm.com &)
[root@pvcent107 ~]# ps -ef |grep www.ibm.com
root???? 16270???? 1? 0 14:13 pts/4??? 00:00:00 ping www.ibm.com
root???? 16278 15362? 0 14:13 pts/4??? 00:00:00 grep www.ibm.com
[root@pvcent107 ~]#
從上例中可以看出幸撕,新提交的進程的父ID(PPID)為1(init 進程的 PID),并不是當前終端的進程 ID外臂。因此并不屬于當前終端的子進程坐儿,從而也就不會受到當前終端的 HUP 信號的影響了。
disown
場景:
我們已經(jīng)知道宋光,如果事先在命令前加上nohup 或者 setsid 就可以避免 HUP 信號的影響貌矿。但是如果我們未加任何處理就已經(jīng)提交了命令,該如何補救才能讓它避免 HUP 信號的影響呢罪佳?
解決方法:
這時想加nohup 或者 setsid 已經(jīng)為時已晚逛漫,只能通過作業(yè)調(diào)度和 disown 來解決這個問題了。讓我們來看一下 disown 的幫助信息:
disown [-ar] [-h] [jobspec ...]
????Without options, each jobspec is? removed? from? the? table? of
????active? jobs.?? If? the -h option is given, each jobspec is not
????removed from the table, but is marked so? that? SIGHUP? is? not
????sent? to the job if the shell receives a SIGHUP.? If no jobspec
????is present, and neither the -a nor the -r option? is? supplied,
????the? current? job? is? used.? If no jobspec is supplied, the -a
????option means to remove or mark all jobs; the -r option? without
????a? jobspec? argument? restricts operation to running jobs.? The
????return value is 0 unless a jobspec does? not? specify? a? valid
????job.
可以看出赘艳,我們可以用如下方式來達成我們的目的酌毡。
? ? 用disown -h?jobspec來使某個作業(yè)忽略HUP信號。
????用disown -ah?來使所有的作業(yè)都忽略HUP信號蕾管。
????用disown -rh?來使正在運行的作業(yè)忽略HUP信號枷踏。
需要注意的是,當使用過disown 之后掰曾,會將把目標作業(yè)從作業(yè)列表中移除旭蠕,我們將不能再使用jobs來查看它,但是依然能夠用ps -ef查找到它旷坦。
但是還有一個問題掏熬,這種方法的操作對象是作業(yè),如果我們在運行命令時在結(jié)尾加了"&"來使它成為一個作業(yè)并在后臺運行塞蹭,那么就萬事大吉了孽江,我們可以通過jobs命令來得到所有作業(yè)的列表。但是如果并沒有把當前命令作為作業(yè)來運行番电,如何才能得到它的作業(yè)號呢岗屏?答案就是用CTRL-z(按住Ctrl鍵的同時按住z鍵)了辆琅!
CTRL-z 的用途就是將當前進程掛起(Suspend),然后我們就可以用jobs命令來查詢它的作業(yè)號这刷,再用bg?jobspec來將它放入后臺并繼續(xù)運行婉烟。需要注意的是,如果掛起會影響當前進程的運行結(jié)果暇屋,請慎用此方法似袁。
disown 示例1(如果提交命令時已經(jīng)用“&”將命令放入后臺運行,則可以直接使用“disown”
[root@pvcent107 build]# cp -r testLargeFile largeFile &
[1] 4825
[root@pvcent107 build]# jobs
[1]+? Running???????????????? cp -i -r testLargeFile largeFile &
[root@pvcent107 build]# disown -h %1
[root@pvcent107 build]# ps -ef |grep largeFile
root????? 4825?? 968? 1 09:46 pts/4??? 00:00:00 cp -i -r testLargeFile largeFile
root????? 4853?? 968? 0 09:46 pts/4??? 00:00:00 grep largeFile
[root@pvcent107 build]# logout
disown 示例2(如果提交命令時未使用“&”將命令放入后臺運行咐刨,可使用 CTRL-z 和“bg”將其放入后臺昙衅,再使用“disown”)
[root@pvcent107 build]# cp -r testLargeFile largeFile2
[1]+? Stopped???????????????? cp -i -r testLargeFile largeFile2
[root@pvcent107 build]# bg %1
[1]+ cp -i -r testLargeFile largeFile2 &
[root@pvcent107 build]# jobs
[1]+? Running???????????????? cp -i -r testLargeFile largeFile2 &
[root@pvcent107 build]# disown -h %1
[root@pvcent107 build]# ps -ef |grep largeFile2
root????? 5790? 5577? 1 10:04 pts/3??? 00:00:00 cp -i -r testLargeFile largeFile2
root????? 5824? 5577? 0 10:05 pts/3??? 00:00:00 grep largeFile2
[root@pvcent107 build]#
screen
場景:
我們已經(jīng)知道了如何讓進程免受HUP 信號的影響,但是如果有大量這種命令需要在穩(wěn)定的后臺里運行定鸟,如何避免對每條命令都做這樣的操作呢而涉?
解決方法:
此時最方便的方法就是screen 了。簡單的說联予,screen 提供了 ANSI/VT100 的終端模擬器啼县,使它能夠在一個真實終端下運行多個全屏的偽終端。screen 的參數(shù)很多沸久,具有很強大的功能季眷,我們在此僅介紹其常用功能以及簡要分析一下為什么使用 screen 能夠避免 HUP 信號的影響。我們先看一下 screen 的幫助信息:
SCREEN(1)?????????????????????????????????????????????????????????? SCREEN(1)
NAME
???????screen - screen manager with VT100/ANSI terminal emulation
SYNOPSIS
???????screen [ -options ] [ cmd [ args ] ]
???????screen -r [[pid.]tty[.host]]
???????screen -r sessionowner/[[pid.]tty[.host]]
DESCRIPTION
???????Screen? is? a? full-screen? window manager that multiplexes a physical
???????terminal between several? processes? (typically? interactive? shells).
???????Each? virtual? terminal provides the functions of a DEC VT100 terminal
???????and, in addition, several control functions from the? ISO? 6429? (ECMA
???????48,? ANSI? X3.64)? and ISO 2022 standards (e.g. insert/delete line and
???????support for multiple character sets).? There is a? scrollback? history
???????buffer? for? each virtual terminal and a copy-and-paste mechanism that
???????allows moving text regions between windows.
使用screen 很方便卷胯,有以下幾個常用選項:
[if !supportLists]·?[endif]用screen -dmS?session name來建立一個處于斷開模式下的會話(并指定其會話名)子刮。
????用screen -list?來列出所有會話。
????用screen -r?session name來重新連接指定會話窑睁。
????用快捷鍵CTRL-a d?來暫時斷開當前會話话告。
screen 示例
[root@pvcent107 ~]# screen -dmS Urumchi
[root@pvcent107 ~]# screen -list
There is a screen on:
????????12842.Urumchi?? (Detached)
1 Socket in /tmp/screens/S-root.
[root@pvcent107 ~]# screen -r Urumchi
當我們用“-r”連接到 screen 會話后,我們就可以在這個偽終端里面為所欲為卵慰,再也不用擔心 HUP 信號會對我們的進程造成影響沙郭,也不用給每個命令前都加上“nohup”或者“setsid”了。這是為什么呢裳朋?讓我來看一下下面兩個例子吧病线。
1. 未使用 screen 時新進程的進程樹
[root@pvcent107 ~]# ping www.google.com &
[1] 9499
[root@pvcent107 ~]# pstree -H 9499
init─┬─Xvnc
?????├─acpid
?????├─atd
?????├─2*[sendmail]
?????├─sshd─┬─sshd───bash───pstree
?????│?????? └─sshd───bash───ping
我們可以看出,未使用screen 時我們所處的 bash 是 sshd 的子進程鲤嫡,當 ssh 斷開連接時送挑,HUP 信號自然會影響到它下面的所有子進程(包括我們新建立的 ping 進程)。
2. 使用了 screen 后新進程的進程樹
[root@pvcent107 ~]# screen -r Urumchi
[root@pvcent107 ~]# ping www.ibm.com &
[1] 9488
[root@pvcent107 ~]# pstree -H 9488
init─┬─Xvnc
?????├─acpid
?????├─atd
?????├─screen───bash───ping
?????├─2*[sendmail]
而使用了screen 后就不同了暖眼,此時 bash 是 screen 的子進程惕耕,而 screen 是 init(PID為1)的子進程。那么當 ssh 斷開連接時诫肠,HUP 信號自然不會影響到 screen 下面的子進程了司澎。
其它
方法一:
????1. 執(zhí)行腳本test.sh:./test.sh
????2. 中斷腳本test.sh:ctrl+c
????3. 在1的基礎(chǔ)上將運行中的test.sh欺缘,切換到后臺并暫停:ctrl+z
????4. 執(zhí)行ctrl+z后,test.sh在后臺是暫停狀態(tài)(stopped),使用命令:bg number讓其在后臺開始運行(“number”是使用jobs命令查到的 [ ]中的數(shù)字挤安,不是pid)
方法二:
????1. 直接在后臺運行腳本test.sh:./test.sh &
????2. 查看當前shell環(huán)境中已啟動的任務(wù)情況:jobs
????3. 將test.sh切換到前臺運行:fg %number(”number”為使用jobs命令查看到的 [ ] 中的數(shù)字谚殊,不是pid)
????4.中斷后臺運行的test.sh腳本:先fg %number切換到前臺,再ctrl+c蛤铜;或是直接kill %number
總結(jié)
現(xiàn)在幾種方法已經(jīng)介紹完畢嫩絮,我們可以根據(jù)不同的場景來選擇不同的方案。nohup/setsid 無疑是臨時需要時最方便的方法围肥,disown 能幫助我們來事后補救當前已經(jīng)在運行了的作業(yè)剿干,而 screen 則是在大批量操作時不二的選擇了。
轉(zhuǎn)載整理自:
https://blog.csdn.net/ruiyelp/article/details/80184249
https://www.ibm.com/developerworks/cn/linux/l-cn-nohup/