記一次root用戶su報(bào)錯(cuò)的處理過程

現(xiàn)象

  1. 直接使用foobar用戶SSH登錄正常
  2. 在root用戶下踢俄,執(zhí)行su - foobar但金,報(bào)錯(cuò):
su: cannot set user id: Resource temporarily unavailable

只有su的時(shí)候報(bào)錯(cuò)褂微,雖然不影響foobar用戶正常的SSH遠(yuǎn)程登錄友题,但這種資源受限的錯(cuò)誤嗤堰,一般都是系統(tǒng)崩潰的前兆,必須要較點(diǎn)真咆爽。

系統(tǒng):RHEL 6.5

排查過程

先按套路出牌

首先直接一通free -m梁棠、 top置森、 vmstat等等,試試運(yùn)氣
不過也不出所料符糊,并沒有什么收獲凫海。但這也算是個(gè)好消息,至少說明不像是系統(tǒng)級(jí)別的資源問題了男娄。

感覺八成是線程數(shù)或者文件打開數(shù)搞的鬼了行贪,懶得監(jiān)控日志,接著排查模闲。

查看線程數(shù)

cat /proc/sys/kernel/threads-max
254529

最大線程數(shù)254529建瘫,沒有問題

ps -u foobar -L | wc -l
1045

用戶當(dāng)前線程數(shù)1045,雖然挺高了尸折,但這個(gè)用戶下部署的應(yīng)用也非常多啰脚,算是正常吧。

檢查ulimit

  1. 先用ulimit看一下設(shè)置的最大文件打開數(shù)
    用foobar直接登錄实夹,然后執(zhí)行:
ulimit -n
655360

顯示655360橄浓,沒有問題

  1. 然后用lsof統(tǒng)計(jì)一下當(dāng)前的文件打開數(shù)
lsof | grep foobar | wc -l
1690

1690,大于1024有點(diǎn)多了亮航,接下來仔細(xì)看一下荸实。

  1. lsof大概的逐條分析一下
lsof | grep foobar
blablabla...
blablabla...
blablabla...

既有文件,也有網(wǎng)絡(luò)連接缴淋。不像是那種同時(shí)發(fā)起了大量網(wǎng)絡(luò)連接造成的故障准给。這里算是PASS了。

檢查limits.conf配置

走到這里重抖,還沒查出問題露氮,就有點(diǎn)意外了,索性再檢查一下limits.conf

cat /etc/security/limits.conf

*    soft    nofile    655360
*    hard    nofile    655360
*    soft    noproc    655360
*    hard    noproc    655360
*    soft    core      0
*    hard    core      0

都是655360钟沛,一眼看上去沒有問題(但這里有個(gè)坑沦辙,稍后會(huì)提到)

檢查各個(gè)profile配置

再檢查各個(gè)profile的配置,例如.bash_profile里是不是手工設(shè)置了過小的ulimit讹剔,導(dǎo)致登錄失敗。

cat /etc/profile
cat /foobar/.bash_profile

都很正常详民,并沒有添加多余的東西進(jìn)去

監(jiān)控系統(tǒng)secure日志

到這時(shí)都沒發(fā)現(xiàn)出問題延欠,只能監(jiān)控系統(tǒng)日志/var/log/secure了。
一邊監(jiān)控沈跨,一邊執(zhí)行su - foobar

tail -f /var/log/secure
blablabla...

Mar 30 12:08:02 localhost crond[29226]: pam_limits(crond:session): unknown limit item 'noproc'

blablabla...

終于抓到一個(gè)問題:noproc參數(shù)是個(gè)什么鬼由捎,應(yīng)該是nproc才對(duì)吧,估計(jì)管理員當(dāng)時(shí)是直接手?jǐn)]的饿凛,沒有復(fù)制粘帖狞玛。

于是趕緊修改limits.conf

vi /etc/security/limits.conf

*    soft    noproc    655360
*    hard    noproc    655360

改為

*    soft    nproc    655360
*    hard    nproc    655360

山窮水盡

解決完上面那個(gè)問題软驰,以為這下可以su成功了吧,然而并沒有心肪,報(bào)錯(cuò)依舊锭亏。

于是繼續(xù)監(jiān)控/var/log/secure日志。現(xiàn)在報(bào)錯(cuò)變成了:

Mar 30 12:10:25 localhost su: pam_unix(su-l:session): session opened for user foobar by monitor(uid=0)
Mar 30 12:10:25 localhost su: pam_unix(su-l:session): session closed for user foobar

這種報(bào)錯(cuò)硬鞍,相當(dāng)于什么也沒說啊慧瘤。看來接下來固该,想要解決問題锅减,只能靠猜了。

一通google之后伐坏,找到了這么一句話:

In Red Hat Enterprise Linux 6, there's a default setting in /etc/security/limits.d/90-nproc.conf. Change the default limit for all users or add a new limit for the affected user.

這個(gè)limits.d/90-nproc.conf之前從沒有注意過怔匣,難道它會(huì)覆蓋 limits.conf 嗎?

cat /etc/security/limits.d/90-nproc.conf
*          soft    nproc     1024
root       soft    nproc     unlimited

這里的值是1024桦沉,嘗試改大一點(diǎn)每瞒,碰碰運(yùn)氣:

vi /etc/security/limits.d/90-nproc.conf
*          soft    nproc     10240
root       soft    nproc     unlimited

然后su - foobar ,竟然成功了永部。

經(jīng)驗(yàn)值+3

到此為止独泞,兩個(gè)坑都已經(jīng)被填上了。耗時(shí)15分鐘苔埋,經(jīng)驗(yàn)值+3:

  1. 遇到類似問題懦砂,直接監(jiān)控/var/log/secure,可以少走些彎路
  2. 注意/etc/security/limits.conf的參數(shù)拼寫
  3. 竟然還有/etc/security/limits.d/90-nproc.conf這么個(gè)東西组橄,且生效的時(shí)機(jī)詭異(只影響su荞膘,直接登錄不受影響)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市玉工,隨后出現(xiàn)的幾起案子羽资,更是在濱河造成了極大的恐慌,老刑警劉巖遵班,帶你破解...
    沈念sama閱讀 221,273評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件屠升,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡狭郑,警方通過查閱死者的電腦和手機(jī)腹暖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,349評(píng)論 3 398
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來翰萨,“玉大人脏答,你說我怎么就攤上這事。” “怎么了殖告?”我有些...
    開封第一講書人閱讀 167,709評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵阿蝶,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我黄绩,道長(zhǎng)羡洁,這世上最難降的妖魔是什么数苫? 我笑而不...
    開封第一講書人閱讀 59,520評(píng)論 1 296
  • 正文 為了忘掉前任眷射,我火速辦了婚禮,結(jié)果婚禮上撤防,老公的妹妹穿的比我還像新娘习劫。我一直安慰自己咆瘟,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,515評(píng)論 6 397
  • 文/花漫 我一把揭開白布诽里。 她就那樣靜靜地躺著袒餐,像睡著了一般。 火紅的嫁衣襯著肌膚如雪谤狡。 梳的紋絲不亂的頭發(fā)上灸眼,一...
    開封第一講書人閱讀 52,158評(píng)論 1 308
  • 那天,我揣著相機(jī)與錄音墓懂,去河邊找鬼焰宣。 笑死,一個(gè)胖子當(dāng)著我的面吹牛捕仔,可吹牛的內(nèi)容都是我干的匕积。 我是一名探鬼主播,決...
    沈念sama閱讀 40,755評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼榜跌,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼闪唆!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起钓葫,我...
    開封第一講書人閱讀 39,660評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤悄蕾,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后础浮,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體帆调,經(jīng)...
    沈念sama閱讀 46,203評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,287評(píng)論 3 340
  • 正文 我和宋清朗相戀三年豆同,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了贷帮。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,427評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡诱告,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情精居,我是刑警寧澤锄禽,帶...
    沈念sama閱讀 36,122評(píng)論 5 349
  • 正文 年R本政府宣布,位于F島的核電站靴姿,受9級(jí)特大地震影響沃但,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜佛吓,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,801評(píng)論 3 333
  • 文/蒙蒙 一宵晚、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧维雇,春花似錦淤刃、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,272評(píng)論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至津滞,卻和暖如春铝侵,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背触徐。 一陣腳步聲響...
    開封第一講書人閱讀 33,393評(píng)論 1 272
  • 我被黑心中介騙來泰國打工咪鲜, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人撞鹉。 一個(gè)月前我還...
    沈念sama閱讀 48,808評(píng)論 3 376
  • 正文 我出身青樓疟丙,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國和親孔祸。 傳聞我的和親對(duì)象是個(gè)殘疾皇子隆敢,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,440評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容

  • 背景:在某年某月某日發(fā)現(xiàn)es運(yùn)行不正常,查看日志發(fā)現(xiàn)如下錯(cuò)誤 以下為操作步驟:1.查看es節(jié)點(diǎn)信息結(jié)果: 疑問:明...
    imsilence閱讀 3,911評(píng)論 0 0
  • linux資料總章2.1 1.0寫的不好抱歉 但是2.0已經(jīng)改了很多 但是錯(cuò)誤還是無法避免 以后資料會(huì)慢慢更新 大...
    數(shù)據(jù)革命閱讀 12,175評(píng)論 2 33
  • 最近公司購買了一臺(tái)新的服務(wù)器崔慧,我負(fù)責(zé)給這臺(tái)服務(wù)器安裝oracle ,磕磕絆絆的終于裝好了拂蝎,但是卻花了不少時(shí)間,算起...
    testerPM閱讀 9,150評(píng)論 3 8
  • 近兩天在CentOS7上安裝了oracle惶室,在網(wǎng)上找了一些資料温自,發(fā)現(xiàn)不是很全面,為了方便以后再次安裝皇钞,所以...
    即墨雨閱讀 6,132評(píng)論 1 11
  • 今天雨天悼泌,雖然沒有感冒,可是我想嘗嘗自己煮的紅糖姜茶是什么味道夹界。 從舊舊的冰箱里面拿出一小塊姜馆里,切口姜汁已經(jīng)凝固了...
    sujian閱讀 243評(píng)論 0 0