目的
有同學(xué)看到標(biāo)題就會(huì)說(shuō)5年以上的技術(shù)大咖都傻傻分不清楚,那能成的上大咖辜梳?這還真是的赦政,有朋友在BAT等互聯(lián)網(wǎng)大廠里工作多年胜宇,是做技術(shù)開(kāi)發(fā)的,在業(yè)務(wù)上技術(shù)很牛的,但是有次聊天時(shí)問(wèn)到這個(gè)問(wèn)題桐愉,傻傻分不清楚運(yùn)維具體是干什么的封寞?有哪些分類?這很正常仅财,孔子曰:術(shù)業(yè)有專攻狈究,如是而已。還有一些新人小白想要進(jìn)入這個(gè)行業(yè)盏求,但是很懵懂抖锥,在剛剛接觸,心里就打退堂鼓了碎罚,害怕自己學(xué)不會(huì)搞不定弄不懂磅废。那這里就為大家揭開(kāi)這一職業(yè)的朦朧面紗。
前言
何為運(yùn)維荆烈?運(yùn)維拯勉,從字面意思很好理解,運(yùn)行維護(hù)憔购。有可能你認(rèn)為的運(yùn)維是高大上宫峦,坐在高檔寫字樓里,敲敲電腦動(dòng)動(dòng)手指的玫鸟,可能是風(fēng)吹日曬走街串巷等等导绷。
是的,這些都是運(yùn)維屎飘,但是行業(yè)妥曲,分工以及內(nèi)容都不同∏展海總體來(lái)說(shuō)大致可以分為兩類:線上運(yùn)維和線下運(yùn)維檐盟。而互聯(lián)網(wǎng)運(yùn)維就屬于線上運(yùn)維,共享單車運(yùn)維就是線下運(yùn)維押桃。這里我們聊得就是互聯(lián)網(wǎng)運(yùn)維葵萎。
運(yùn)維前景
要說(shuō)運(yùn)維的前景還是很廣闊的≡构妫可以這么說(shuō)只要有互聯(lián)網(wǎng)就會(huì)需要運(yùn)維陌宿,試問(wèn)下锡足,現(xiàn)在的生活還能沒(méi)有互聯(lián)網(wǎng)嗎波丰?所以,就業(yè)前景還是可以的舶得。就企業(yè)而言掰烟,運(yùn)維屬于技術(shù)職務(wù),所以走的是P路線。什么是P路線呢纫骑?是互聯(lián)網(wǎng)就個(gè)人職業(yè)規(guī)劃的上升和晉級(jí)通道蝎亚,P路線就是技術(shù)路線,M路線就是管理路線先馆。分不同等級(jí)发框,逐級(jí)或跨級(jí)晉升,當(dāng)然不能等級(jí)體現(xiàn)了你的能力高低刨沦。我們常常自嘲為“打雜的”堕扶,因?yàn)檫\(yùn)維是技術(shù)支持部門簸搞,是為開(kāi)發(fā)出產(chǎn)品后上線提供支持的,所以很多東西都需要懂铣减。所以如果想要從事這個(gè)行業(yè)先有個(gè)心理準(zhǔn)備。技術(shù)方面有兩個(gè)維度:深度和廣度脚作。就運(yùn)維而言葫哗,廣度是第一要求,你不需要精球涛,但是一定要知道劣针。深度在根據(jù)自己的規(guī)劃方向再深入研究。就廣度來(lái)說(shuō)亿扁,從網(wǎng)絡(luò)酿秸,服務(wù)器,系統(tǒng)魏烫,環(huán)境辣苏,應(yīng)用,監(jiān)控哄褒,虛擬化稀蟋,容器化,自動(dòng)化呐赡,智能化等等退客,需要學(xué)的太多了。還有链嘀,有人說(shuō):“運(yùn)維是吃青春飯的”萌狂,對(duì)也不對(duì),對(duì)的是做技術(shù)的怀泊,年齡大了操作和思維等肯定不如年輕人茫藏,不對(duì)的是:看能力,能力比較牛霹琼,不可替代务傲,無(wú)論年齡多大都有市場(chǎng)凉当。就單純的說(shuō)運(yùn)維晉升:初級(jí),中級(jí)售葡,高級(jí)看杭,資深,架構(gòu)師挟伙,CTO楼雹。少年,你做好準(zhǔn)備了嗎尖阔?
運(yùn)維分類
有很多程序員都是宅男烘豹,單身,過(guò)年過(guò)節(jié)回家诺祸,親戚朋友問(wèn)到從事的職業(yè)被戲稱為修電腦的携悯。但是只要是從事技術(shù)的,哪怕是剛?cè)胄械男“卓瓯浚材軌蛄私馇宄诸愩竟恚ぞ叩取R话愠绦騿T根據(jù)開(kāi)發(fā)語(yǔ)言劃分的胃夏,像:php轴或,java, C++,Go等等仰禀,根據(jù)業(yè)務(wù)劃分可分為:前端和后端照雁。這些基本就可以涵蓋所有了。而運(yùn)維的分類是怎樣的呢答恶?問(wèn)什么會(huì)讓很多人傻傻分不清和懵懂呢饺蚊?各自有哪些職責(zé)呢?按職責(zé)劃分運(yùn)維的分類大致可以分為應(yīng)用運(yùn)維悬嗓,系統(tǒng)運(yùn)維污呼,運(yùn)維研發(fā),數(shù)據(jù)庫(kù)運(yùn)維和運(yùn)維安全包竹。如下圖所示:
那下面我們就逐個(gè)介紹下燕酷。
應(yīng)用運(yùn)維
應(yīng)用運(yùn)維也是大部分人所認(rèn)知的運(yùn)維,應(yīng)用運(yùn)維根據(jù)字面意思就可以知道是和應(yīng)用維護(hù)的周瞎。主要負(fù)責(zé)線上服務(wù)的發(fā)布變更苗缩、服務(wù)健康狀況監(jiān)控、服務(wù)的容災(zāi)高可用和數(shù)據(jù)安全備份等工作声诸。針對(duì)這些工作需要對(duì)服務(wù)進(jìn)行巡檢了解服務(wù)狀況酱讶,服務(wù)出故障的應(yīng)急處理和排查優(yōu)化。下面詳細(xì)的職責(zé)如下所述双絮。
評(píng)審
在產(chǎn)品研發(fā)階段浴麻,參與產(chǎn)品設(shè)計(jì)評(píng)審,從運(yùn)維的角度提出評(píng)審意見(jiàn)囤攀,使服務(wù)滿足準(zhǔn)入要求软免,盡快上線并預(yù)備高可用等方案。
服務(wù)
服務(wù)管理主要就是發(fā)布系統(tǒng)焚挠,制定線上業(yè)務(wù)的升級(jí)變更及回滾方案膏萧,并根據(jù)申請(qǐng)進(jìn)行變更的實(shí)施。掌握所負(fù)責(zé)的服務(wù)及服務(wù)間的依賴關(guān)聯(lián)關(guān)系中的各種資源蝌衔。能夠發(fā)現(xiàn)服務(wù)上的缺陷榛泛,及時(shí)通報(bào)并推進(jìn)解決。制定服務(wù)的穩(wěn)定性指標(biāo)及準(zhǔn)入標(biāo)準(zhǔn)方案噩斟,同時(shí)不斷完善和優(yōu)化程序和系統(tǒng)的功能曹锨、效率,提高運(yùn)行質(zhì)量剃允,完善監(jiān)控內(nèi)容沛简,提高報(bào)警準(zhǔn)確度。在線上服務(wù)出現(xiàn)故障時(shí)斥废,第一時(shí)間響應(yīng)椒楣,對(duì)已知的故障能按流程進(jìn)行通報(bào)并按預(yù)案執(zhí)行,未知故障組織相關(guān)人員進(jìn)行聯(lián)合排障牡肉。
資源
對(duì)各個(gè)服務(wù)使用的服務(wù)器資產(chǎn)進(jìn)行管理捧灰,梳理服務(wù)器資源實(shí)時(shí)狀況、IDC數(shù)據(jù)中心分布情況统锤、網(wǎng)絡(luò)專線及帶寬情況毛俏,能夠合理使用服務(wù)器資源,根據(jù)不同服務(wù)的需求饲窿,分配不同配置的服務(wù)器拧抖,確保服務(wù)器資源的充分利用。
巡檢
實(shí)時(shí)了解服務(wù)的運(yùn)行狀況免绿,制定服務(wù)的例行排查點(diǎn)唧席,并不斷完善。并根據(jù)制定的服務(wù)排查點(diǎn)嘲驾,對(duì)服務(wù)進(jìn)行定期檢查淌哟。對(duì)排查過(guò)程中發(fā)現(xiàn)的問(wèn)題,及時(shí)進(jìn)行追查處理辽故,排除可能存在的隱患和痛點(diǎn)
監(jiān)控
確定服務(wù)存活狀態(tài)正常徒仓,對(duì)服務(wù)的各項(xiàng)性能、系統(tǒng)的指標(biāo)閾值或臨界點(diǎn)安排合理誊垢,以及對(duì)出現(xiàn)該異常后的處理制定預(yù)案掉弛。建立和更新和維護(hù)服務(wù)預(yù)案文檔症见,并根據(jù)日常故障情況不斷補(bǔ)充完善,提高預(yù)案完備性殃饿。周期性進(jìn)行預(yù)案演練谋作,確保預(yù)案的可行性。
備份
制定業(yè)務(wù)數(shù)據(jù)的備份方案乎芳,按策略對(duì)數(shù)據(jù)進(jìn)行備份和冗余工作遵蚜。保證數(shù)據(jù)備份的可用性,完整性和安全性奈惑,定期開(kāi)展數(shù)據(jù)恢復(fù)性測(cè)試吭净。
系統(tǒng)運(yùn)維
系統(tǒng)運(yùn)維主要和系統(tǒng)及底層網(wǎng)絡(luò)等打交道,如:IDC機(jī)房肴甸、網(wǎng)絡(luò)拓?fù)浼叛场DN加速和基礎(chǔ)服務(wù)的建設(shè)等;對(duì)所有服務(wù)器的資產(chǎn)進(jìn)行管理原在,服務(wù)器的調(diào)研選型不撑、交付上架和后期維護(hù)等。詳細(xì)的工作職責(zé)如下:
IDC機(jī)房
根據(jù)業(yè)務(wù)申請(qǐng)需求晤斩,預(yù)估未來(lái)數(shù)據(jù)中心的發(fā)展規(guī)模焕檬,從骨干網(wǎng)絡(luò)的分布,數(shù)據(jù)中心建筑可靠性澳泵,以及Internet的接入实愚、網(wǎng)絡(luò)中的攻擊防御、擴(kuò)容兔辅、空間預(yù)留腊敲、外接專線、現(xiàn)場(chǎng)支撐等方面维苔。
網(wǎng)絡(luò)
設(shè)計(jì)及規(guī)劃生產(chǎn)網(wǎng)絡(luò)架構(gòu)碰辅,這里面包括:數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)、傳輸網(wǎng)架構(gòu)介时、CDN網(wǎng)絡(luò)架構(gòu)等没宾,以及網(wǎng)絡(luò)調(diào)優(yōu)等日常運(yùn)維工作。
基礎(chǔ)服務(wù)
根據(jù)網(wǎng)絡(luò)規(guī)模和業(yè)務(wù)需求沸柔,構(gòu)建負(fù)載均衡集群循衰,完成網(wǎng)絡(luò)與業(yè)務(wù)服務(wù)器的銜接,提供高性能褐澎、高可用的負(fù)載調(diào)度能力会钝,以及統(tǒng)一的網(wǎng)絡(luò)層防御能力;通過(guò)集群化部署工三,保證公網(wǎng)訪問(wèn)服務(wù)的高性能與高可用迁酸。有些服務(wù)需要借助于第三方的先鱼,對(duì)第三方進(jìn)行測(cè)試選型和調(diào)度控制,監(jiān)控等等奸鬓,保障系統(tǒng)穩(wěn)定焙畔、高效運(yùn)行。
服務(wù)器
服務(wù)器的測(cè)試和選型全蝶,包含服務(wù)器整機(jī)闹蒜、部件的基礎(chǔ)性測(cè)試和業(yè)務(wù)壓力測(cè)試寺枉,降低整機(jī)功率抑淫,規(guī)劃服務(wù)器上架位置,在保證溫濕度的情況下姥闪,提升部署密度始苇,降低成本;服務(wù)器硬件故障的診斷排查和定位筐喳,服務(wù)器溫濕度轉(zhuǎn)速等硬件監(jiān)控等催式;
操作系統(tǒng)
所有平臺(tái)的操作系統(tǒng)選型、定制和內(nèi)核優(yōu)化避归,以及漏洞補(bǔ)丁的更新和內(nèi)部版本升級(jí)荣月;建立統(tǒng)一的軟件包管理和分發(fā)中心庫(kù),以及現(xiàn)在用的很多的maven依賴包倉(cāng)庫(kù)和Docker容器倉(cāng)庫(kù)梳毙;
資產(chǎn)管理
記錄和管理所有基礎(chǔ)物理信息哺窄,包括IDC數(shù)據(jù)中心、網(wǎng)絡(luò)信息账锹、機(jī)架機(jī)柜位置萌业、服務(wù)器型號(hào)信息,售后信息等等各種資源信息奸柬,制定有效合理的流程生年,確保信息的準(zhǔn)確性;
運(yùn)維開(kāi)發(fā)
運(yùn)維平臺(tái)設(shè)計(jì),開(kāi)發(fā)和實(shí)施部署廓奕,如:用戶管理抱婉,資產(chǎn)管理、監(jiān)控系統(tǒng)桌粉、發(fā)布平臺(tái)授段、權(quán)限管理系統(tǒng)等等。提供各種接口番甩,封裝更高層的自動(dòng)化運(yùn)維系統(tǒng)侵贵。詳細(xì)的工作職責(zé)如下所述。
發(fā)布平臺(tái)
記錄關(guān)聯(lián)關(guān)系缘薛,協(xié)助運(yùn)維人員對(duì)日常運(yùn)維標(biāo)準(zhǔn)化窍育,流程化進(jìn)而自動(dòng)化卡睦,包括服務(wù)器的管理如:重啟、改名漱抓、初始化表锻、域名管理、流量切換和故障預(yù)案實(shí)施等乞娄。
監(jiān)控系統(tǒng)
監(jiān)控系統(tǒng)的調(diào)研選型瞬逊,對(duì)服務(wù)器和各種網(wǎng)絡(luò)設(shè)備的資源性能指標(biāo)、業(yè)務(wù)性能指標(biāo)的收集仪或、告警确镊、存儲(chǔ)、分析范删、展示和數(shù)據(jù)分析等工作蕾域,保證公司服務(wù)器資源的合理化調(diào)配,持續(xù)提高告警的及時(shí)性到旦、準(zhǔn)確性和有效性旨巷,對(duì)監(jiān)控進(jìn)行聚合,進(jìn)而實(shí)現(xiàn)智能化報(bào)警監(jiān)控添忘。
自動(dòng)化平臺(tái)
自動(dòng)化系統(tǒng)的開(kāi)發(fā)采呐,自動(dòng)化部署系統(tǒng)所需要的各種數(shù)據(jù)和信息。結(jié)合云計(jì)算搁骑,區(qū)塊鏈等技術(shù)斧吐,研發(fā)和提供PaaS相關(guān)高可用平臺(tái),提高服務(wù)的部署有效性和穩(wěn)定性靶病,提高資源利用率会通。
數(shù)據(jù)庫(kù)運(yùn)維
數(shù)據(jù)庫(kù)運(yùn)維需要對(duì)庫(kù)、表娄周、索引和SQL等制定規(guī)范涕侈,對(duì)數(shù)據(jù)庫(kù)進(jìn)行變更、監(jiān)控煤辨、備份裳涛、高可用設(shè)計(jì)等工作。詳細(xì)的工作職責(zé)如下所述众辨。
評(píng)審
在產(chǎn)品研發(fā)階段端三,參與設(shè)計(jì)方案評(píng)審,從DBA的角度提出數(shù)據(jù)存儲(chǔ)鹃彻、庫(kù)表設(shè)計(jì)郊闯,索引設(shè)計(jì)等方案、SQL開(kāi)發(fā)標(biāo)準(zhǔn),使服務(wù)滿足數(shù)據(jù)庫(kù)的高可用团赁、高性能要求育拨。
容量
掌握所負(fù)責(zé)服務(wù)數(shù)據(jù)庫(kù)的容量上限,清楚地了解瓶頸點(diǎn)欢摄,當(dāng)服務(wù)將觸及容量閾值時(shí)熬丧,及時(shí)優(yōu)化、分拆或者擴(kuò)容等
備份與災(zāi)備
制定數(shù)據(jù)備份與災(zāi)備策略方案怀挠,定期對(duì)數(shù)據(jù)進(jìn)行恢復(fù)性測(cè)試析蝴,保證數(shù)據(jù)備份的有效性,可用性和完整性绿淋。
監(jiān)控
對(duì)數(shù)據(jù)庫(kù)存活和各項(xiàng)性能指標(biāo)監(jiān)控闷畸,及時(shí)了解數(shù)據(jù)庫(kù)的運(yùn)行狀態(tài)。
安全
建立數(shù)據(jù)庫(kù)賬號(hào)和權(quán)限控制體系躬它,有效降低誤操作和數(shù)據(jù)泄露的風(fēng)險(xiǎn)腾啥;加強(qiáng)離線備份數(shù)據(jù)的管理东涡,降低數(shù)據(jù)泄露的風(fēng)險(xiǎn)冯吓。
性能優(yōu)化
對(duì)數(shù)據(jù)庫(kù)風(fēng)險(xiǎn)點(diǎn)有備用或切換方案,降低故障對(duì)數(shù)據(jù)庫(kù)的影響疮跑;對(duì)數(shù)據(jù)庫(kù)性能進(jìn)行優(yōu)化组贺,包括存儲(chǔ)方案改進(jìn)、硬件資源優(yōu)化祖娘、文件系統(tǒng)優(yōu)化失尖、庫(kù)表優(yōu)化、SQL優(yōu)化等渐苏。
自動(dòng)化
開(kāi)發(fā)數(shù)據(jù)庫(kù)自動(dòng)化平臺(tái)掀潮,包括數(shù)據(jù)庫(kù)部署、自動(dòng)擴(kuò)容琼富、分庫(kù)分表仪吧、權(quán)限管理、備份恢復(fù)鞠眉、SQL審核和上線薯鼠、故障處理等。
運(yùn)維安全
運(yùn)維安全負(fù)責(zé)各方面的安全加固工作械蹋,進(jìn)行安全掃描出皇、滲透測(cè)試,進(jìn)行安全工具和系統(tǒng)研發(fā)以及安全事件應(yīng)急處理哗戈。詳細(xì)的工作職責(zé)如下所述郊艘。
安全文檔
根據(jù)公司內(nèi)部的具體流程,制定切實(shí)可行且行之有效的安全方案和制度。
安全培訓(xùn)
定期向員工提供具有安全培訓(xùn)和考核纱注,在公司內(nèi)建立安全負(fù)責(zé)人制度步做。
風(fēng)險(xiǎn)評(píng)估
通過(guò)黑白盒測(cè)試和檢查機(jī)制,對(duì)網(wǎng)絡(luò)奈附、服務(wù)器全度、業(yè)務(wù)、用戶數(shù)據(jù)等方面的風(fēng)險(xiǎn)評(píng)估斥滤。
安全
根據(jù)風(fēng)險(xiǎn)評(píng)估報(bào)告将鸵,加固薄弱環(huán)節(jié),包括設(shè)計(jì)安全防線佑颇、部署安全設(shè)備顶掉、更新補(bǔ)丁、防御病毒挑胸、源代碼自動(dòng)掃描和業(yè)務(wù)產(chǎn)品安全咨詢等等痒筒。通過(guò)加密、匿名化茬贵、混淆數(shù)據(jù)簿透,乃至定期刪除等技術(shù)手段和流程來(lái)降低可能泄露數(shù)據(jù)的風(fēng)險(xiǎn)。
安全合規(guī)
為了滿足合規(guī)性要求例如金融牌照解藻,支付牌照等老充,安全團(tuán)隊(duì)承擔(dān)著對(duì)外安全合規(guī)的接口人角色。
應(yīng)急響應(yīng)
建立安全報(bào)警系統(tǒng)螟左,通過(guò)安全中心收集第三方發(fā)現(xiàn)的安全問(wèn)題啡浊,評(píng)估影響面,組織各部門對(duì)已經(jīng)發(fā)現(xiàn)的安全問(wèn)題進(jìn)行修復(fù)和事后造成安全的追查胶背。