Web運(yùn)維要求理解架構(gòu)中的各個(gè)組成部分,在理解計(jì)算系統(tǒng)的來(lái)龍去脈時(shí),扎實(shí)的計(jì)算背景對(duì)你會(huì)有莫大的幫助。處理器體系結(jié)構(gòu)、內(nèi)存系統(tǒng)、存儲(chǔ)系統(tǒng)、網(wǎng)絡(luò)交換與路由、為何第二層協(xié)議那樣工作、HTTP、數(shù)據(jù)庫(kù)概念…這個(gè)清單可以列好幾頁(yè)。具有扎實(shí)的基礎(chǔ),對(duì)于理解為什么及如何架構(gòu)解決方案,以及識(shí)別出問(wèn)題所在,是非常重要的,畢竟,計(jì)算是架構(gòu)我們的智能系統(tǒng)的基礎(chǔ)。此外,工程師的思維方式和對(duì)物理定律的基本理解也是一個(gè)很大的優(yōu)勢(shì)。
一天,在喝酒聊天的時(shí)候,我的一位朋友,也是Web運(yùn)維領(lǐng)域的同行, Jesse Robbins,講了一個(gè)排查衛(wèi)星電話線路故障的故事。一套衛(wèi)星電話設(shè)施安裝好了,而線路有超過(guò)一秒的非預(yù)期”延遲。這是很久以前的事了,這套衛(wèi)星電話設(shè)施已經(jīng)花了一大筆錢(qián),所以,客戶對(duì)于服務(wù)質(zhì)量感到非常沮喪。經(jīng)過(guò)好幾個(gè)小時(shí)的排查和連續(xù)的調(diào)優(yōu)之后,技術(shù)人員問(wèn)道:“先要搞清楚,這一秒的延遲是算到預(yù)期的延遲時(shí)間里的,對(duì)不對(duì)?”一陣長(zhǎng)時(shí)間的沉默之后,客戶問(wèn):“什么是預(yù)期延遲?”技術(shù)人員首先向請(qǐng)來(lái)的所有人為浪費(fèi)他們的時(shí)間而道歉,然后嚴(yán)厲地斥責(zé)客戶,說(shuō)他浪費(fèi)了所有人的時(shí)問(wèn)。所謂預(yù)期延遲就是將信號(hào)送到外層空間的衛(wèi)星再返回所需要的時(shí)間,我們就是再怎么努力,也沒(méi)有辦法增加光的速度啊。盡管這個(gè)故事看起來(lái)很愚鑫,我卻經(jīng)常遇到這種隨意的、不切實(shí)際的期望??赡茏钇胀ǖ木褪强缰尥綇?fù)制的企圖了,就是公然藐視我們目前所知的物理定律嘛。我們還是努力成為一個(gè)維護(hù)好站點(diǎn)可靠性的工程師吧,盡量將計(jì)算機(jī)科學(xué)和物理學(xué)的基本原理付諸實(shí)踐。要在理論限度內(nèi)做好工作,你必須知道這些限度是什么以及在哪里,這就是為什么計(jì)算機(jī)科學(xué)、物理學(xué)、電氣工程,以及應(yīng)用數(shù)學(xué)的理論知識(shí)真正不可缺少的原因。
運(yùn)維,就是理解理論和實(shí)踐在哪里發(fā)生沖突,并發(fā)明適當(dāng)?shù)姆椒ǎ员阍诎l(fā)生事故時(shí)減少損失。
嫻熟的決斷力
雖然優(yōu)柔寡斷在任何領(lǐng)域都不算是一個(gè)優(yōu)點(diǎn),但在Web運(yùn)維中卻幾乎不能容忍。像急救中心和急診室的醫(yī)生一樣,你會(huì)經(jīng)常常面臨這樣的境地,此日時(shí)單有良好的判斷力是不夠的這一點(diǎn)你可要明白。決策的遲延就會(huì)導(dǎo)致宕機(jī)的持續(xù),所以必須訓(xùn)練你的大腦持續(xù)不斷地對(duì)接收到的輸入做出反應(yīng),因?yàn)槟欠N“收集、審查、建議”的方式將會(huì)導(dǎo)致局面不可收拾。
在計(jì)算機(jī)科學(xué)中,算法有兩種類(lèi)型:離線和在線。離線算法是指在確定輸出之前,整個(gè)輸入集都已獲得的解決方案。與此相反,在線算法是指邊獲取輸入邊產(chǎn)生輸出。當(dāng)然,由于算法在產(chǎn)生輸出(或解決方案)時(shí),并沒(méi)有獲得整個(gè)輸入集,也就沒(méi)有辦法保證產(chǎn)生最優(yōu)化的輸出。與離線算法不同的是,在線算法保證你手上總是有答案。
運(yùn)維決策必須是在線算法的結(jié)果,而非離線算法。這并不是說(shuō)離線算法在Web運(yùn)維中就沒(méi)有地位了,恰恰相反,其中一個(gè)非常關(guān)鍵的過(guò)程就是離線的,那就是根本原因分析(RCA)。對(duì)于盡可能地形式化RCA過(guò)程,我可是有巨大熱情的。
對(duì)失敗及其癥狀表現(xiàn)以及“即時(shí)”決策的復(fù)審進(jìn)行徹底的離線(事后)分析,是改進(jìn)在線算法(你和你的團(tuán)隊(duì)用于關(guān)鍵運(yùn)維決策)的可能的最好途徑。
沉穩(wěn)的性格
一個(gè)沉穩(wěn)與可控的思維過(guò)程是非常關(guān)鍵的,沒(méi)有它,就會(huì)出現(xiàn)吉斯通警察綜合征,使糟糕的局面變得更加不可收拾。在瘋狂的動(dòng)作片中,一個(gè)人崩潰了,另一個(gè)人就抓住他使勁搖晃,告訴他要鎮(zhèn)定下來(lái)一一在這種情形下,你要確定你是處在清醒的一方的。在清醒的一方,你就會(huì)有一個(gè)快樂(lè)、健康的職業(yè),否則,你得到的將是一份沉重的工作,弄不好,將會(huì)不堪重負(fù)。
因?yàn)闆](méi)有正式的教育途徑,Web運(yùn)維行業(yè),就其目前的狀況而言,是一種非正式的師徒模型。互聯(lián)網(wǎng)的廣泛應(yīng)用,已使商務(wù)和社會(huì)交往發(fā)生了范式轉(zhuǎn)移,而且信息已經(jīng)在某種程度上唾手可及,從而一種虛擬的師徒模型便成為可能。不幸的是,正如你能夠料想到的,在不同的群組之間,這種師徒模型的質(zhì)量也是千差萬(wàn)別的。
在網(wǎng)站建設(shè)Web運(yùn)維領(lǐng)域,目標(biāo)很簡(jiǎn)單,使所有事情在所有時(shí)間正常運(yùn)轉(zhuǎn):一個(gè)簡(jiǎn)單的定義,但卻是一個(gè)不可能的期望?;蛟S在這個(gè)領(lǐng)域成為一名工程師的更大挑戰(zhàn)是組織內(nèi)的同事對(duì)你的不切實(shí)際的期望。
本文地址:http://www.khwajamoinuddinchishty.com//article/3302.html