我最近又一次剛剛解決了工作中的一個(gè)不大不小的技術(shù)問(wèn)題,想分享下自己的這個(gè)簡(jiǎn)單的方法論:排除法。
先說(shuō)說(shuō)這個(gè)問(wèn)題是什么,我又是怎么解決的惹悄。因?yàn)楫a(chǎn)品需要,購(gòu)買了淘寶上的一種mini主機(jī)肩钠,決定采用Linux系統(tǒng)做產(chǎn)品泣港,首先就要解決發(fā)行版的問(wèn)題。經(jīng)過(guò)比較選擇价匠,初步選用Manjaro Linux当纱。但是上周突然發(fā)現(xiàn)一個(gè)很詭異的現(xiàn)象:?jiǎn)?dòng)時(shí)間太長(zhǎng),每次啟動(dòng)的時(shí)間從幾秒鐘到2分半種不等踩窖。我這么描述坡氯,實(shí)際上不夠精確,那么啟動(dòng)時(shí)間是什么呢洋腮?從電源開(kāi)啟箫柳,到自動(dòng)登錄完成并且桌面顯示出來(lái)了,總共的時(shí)間啥供。而這里面最有意思的是會(huì)在桌面顯示出來(lái)之前會(huì)有一個(gè)黑屏?xí)r間悯恍,這個(gè)時(shí)間是不太固定的。作為企業(yè)產(chǎn)品伙狐,啟動(dòng)時(shí)間慢和不固定都是不能容忍的涮毫。那么,怎么來(lái)解決這個(gè)問(wèn)題呢贷屎?其實(shí)罢防,我一直在使用排除法,縮小問(wèn)題的范圍唉侄,直到最終精準(zhǔn)定位咒吐。
第一個(gè)范圍排除:顯示相關(guān)還是其他?為了搞清楚系統(tǒng)是不是其他部分都啟動(dòng)了属划,而顯示部分可能會(huì)滯后恬叹,將系統(tǒng)的ssh服務(wù)開(kāi)啟,當(dāng)發(fā)現(xiàn)“卡死”的時(shí)候榴嗅,立刻從另一個(gè)機(jī)器去遠(yuǎn)程登錄妄呕,發(fā)現(xiàn)每次都能登錄,因此排除了其他問(wèn)題嗽测,確認(rèn)與顯示相關(guān)绪励。
第二個(gè)范圍排除:是否與自動(dòng)登錄相關(guān)?把系統(tǒng)的自動(dòng)登錄關(guān)掉唠粥,讓啟動(dòng)的時(shí)候必須輸入用戶名密碼疏魏,結(jié)果發(fā)現(xiàn):?jiǎn)栴}消失!這就證明了晤愧,問(wèn)題與自動(dòng)登錄相關(guān)大莫。
第三個(gè)范圍排除:卡在自動(dòng)登錄之前還是自動(dòng)登錄之后?由于是黑屏官份,很不給力只厘,找一下自動(dòng)登錄的機(jī)制烙丛,發(fā)現(xiàn)可以設(shè)置自動(dòng)登錄的延時(shí),默認(rèn)是0羔味,改成3秒河咽,發(fā)現(xiàn)登錄界面閃過(guò),出現(xiàn)了鼠標(biāo)和背景赋元,不動(dòng)忘蟹。原來(lái)黑屏的現(xiàn)象變成了固定背景的問(wèn)題。初步判斷是在自動(dòng)登錄之后搁凸。因此需要研究從登錄到桌面出現(xiàn)媚值,需要經(jīng)過(guò)哪些步驟。
第四個(gè)范圍排除:進(jìn)程篩選护糖。研究了X11的Display Manager(本例中l(wèi)ightdm)和桌面系統(tǒng)(本例中Xfce)的進(jìn)程父子關(guān)系褥芒,通過(guò)ssh,找出卡死的進(jìn)程椅文,最后發(fā)現(xiàn)卡在 gnome_keyring_daemon程序上喂很。
最后,綜合判斷皆刺,給出結(jié)論少辣。gnome_keyring_daemon程序在初始化的時(shí)候會(huì)讀 /dev/random獲得隨機(jī)數(shù),而 /dev/radom 這個(gè)內(nèi)核接口需要足夠的熵來(lái)產(chǎn)生隨機(jī)數(shù)羡蛾,當(dāng)采用自動(dòng)登錄的方案時(shí)漓帅,如果對(duì)系統(tǒng)沒(méi)有任何刺激,內(nèi)核獲得熵的速度會(huì)比較慢痴怨,導(dǎo)致 gnome_keyring_daemon阻塞忙干;此時(shí)如果動(dòng)一動(dòng)鼠標(biāo),則很快進(jìn)入桌面系統(tǒng)浪藻;在手動(dòng)登錄的方案中捐迫,用戶輸入密碼和回車就產(chǎn)生了足夠的熵,進(jìn)入系統(tǒng)也就順利了爱葵。
當(dāng)然施戴,上面說(shuō)到的是一個(gè)簡(jiǎn)化的排查模型,排除法只是一種方法萌丈,需要和其他的一些條件一起使用赞哗。
首先,解決問(wèn)題的信念辆雾。沒(méi)辦法肪笋,作為產(chǎn)品,不解決這個(gè)問(wèn)題沒(méi)法用。當(dāng)遇到岔路時(shí)藤乙,盡管問(wèn)題沒(méi)有解決猜揪,但也學(xué)到了更多的知識(shí),不能氣餒湾盒。我解決這個(gè)問(wèn)題的過(guò)程中一直有一個(gè)支線問(wèn)題在干擾我:系統(tǒng)會(huì)識(shí)別出一個(gè)沒(méi)有硬件連接的筆記本顯示屏湿右。為了排除這種可能,我通過(guò)配置讓系統(tǒng)忽略這個(gè)不存在的顯示屏罚勾,發(fā)現(xiàn)問(wèn)題依舊。這個(gè)做法有兩個(gè)好處:排除了多屏問(wèn)題吭狡,我順便理解了X11的忽略顯示屏配置方法尖殃。另外,當(dāng)自動(dòng)登錄相關(guān)的結(jié)論出來(lái)之后划煮,作為繞過(guò)問(wèn)題的策略送丰,可以設(shè)為手動(dòng)登錄而不去研究,但這樣導(dǎo)致淺嘗輒止弛秋,除非有更重要的事情器躏,這種刨根問(wèn)底的精神不能丟。
其次蟹略,對(duì)比嘗試登失。第二個(gè)范圍排除,我的靈感源于這樣一個(gè)偶然事實(shí):當(dāng)黑屏的時(shí)候挖炬,我動(dòng)動(dòng)鼠標(biāo)或者敲擊鍵盤(pán)揽浙,總是能進(jìn)入系統(tǒng)。沒(méi)有這個(gè)嘗試意敛,我很難想到登錄的問(wèn)題馅巷。
第三,知識(shí)儲(chǔ)備草姻。我對(duì)X11其實(shí)理解得不算太全面钓猬,這次為了解決這個(gè)問(wèn)題,不得不去更深的理解了不同部分的關(guān)系撩独,尤其是啟動(dòng)順序敞曹。
謝謝看完的朋友,這是我博客中的原文鏈接 跌榔。