簡單說來,Web應用慢,是由于下面的三點原因造成的...
在當今本質(zhì)上要求一直在線的Web運維環(huán)境中,基本上沒有時間用于計劃中的停機、維護以及其他影響網(wǎng)站可用性和產(chǎn)生收入的普通操作。本質(zhì)上,沒有時間適合于停機,或適合于影響工作負荷,像例行備份、磁盤損壞、復制、軟件及固件升級等任務都不能干擾工作負荷,設計存儲基礎架構時,必須把這些因素考慮進去。 ...
存儲是很昂貴的,這是當今任何現(xiàn)代基礎架構中成本最高的組件。尤其是在數(shù)據(jù)密集的環(huán)境,存儲了大量用戶產(chǎn)生的內(nèi)容以及數(shù)百萬的用戶數(shù)據(jù)。正是由于這個原因,對于存儲上的開支進行明智地規(guī)劃是很重要的。在我負責部署大規(guī)模存儲的時候,經(jīng)手過大筆的預算,我學到了什么才是關鍵的問題,那就是對你所支持的應用程序為什么需要存儲、應用程序是如何使用存儲的、如何將存儲設計和實現(xiàn)得盡可能高效這些問題有明確、具體的了解。...
在確保有效的數(shù)據(jù)保護之后,作為一名存儲專業(yè)人員,容量規(guī)劃就是第二項最重要的職責。規(guī)劃在前,并且確保應用和服務有足夠的資源來運行和成長,不至于碰到天花板,這不僅是重要的,同時也是必需的。將容量和成長空間提前規(guī)劃為具有足夠的可伸縮性的好處是巨大的,不僅對你,對應用也一樣,都減小了壓力,既能應付應用上出現(xiàn)的非預期的爆炸性增長,也有助于避免資金的非計劃性支出。...
事后分析至少要包含這些內(nèi)容...
對糾正措施必須進行追蹤,直到執(zhí)行完成。要記住,在糾正措施沒有得到完全執(zhí)行之前,事故重發(fā)的風險會一直存在。...
開始事后分析的時候,首先要做的事情就是明確基本規(guī)則,要明確告知參與事后分析的相關各方,事后分析不是指責誰,主要目的是為了使類似事件不再重復發(fā)生??焖侔l(fā)展的互聯(lián)網(wǎng)站,問題是不可避免的,重要的是我們能夠從錯誤中學到教訓。...
構建用于測量(圖示、裝備應用程序)和監(jiān)控(報警)的系統(tǒng)是一項很值得做的事情,這些系統(tǒng)是基礎架構非常重要的核心內(nèi)容,而且做起來也不是那么難。但據(jù)我所知,這些系統(tǒng)卻常常被忽略。如果沒有測量的話,很難對系統(tǒng)實現(xiàn)主動的管理。歷史的測量數(shù)據(jù)對于容量規(guī)劃和錯誤排查尤其有用。...
對于運維來說,對數(shù)據(jù)庫模式進行更新,是許多非常困難的任務之一。將數(shù)據(jù)庫模式與其他更新一起進行同步,有幾種常見的情景:部署、快速開發(fā)、通過修改索引和其他結構優(yōu)化性能。假如模式更新是一種阻塞操作(MYSQL中通常就是這樣的),這就真的成問題了。...
對備份,只是希望在進入正式話題之前,允許給一些小提示。...