伺服器故障應急預案
伺服器故障應急預案
首先分清導致伺服器出故障的因素:
1、外部攻擊
2、內部攻擊
3、運維誤操作
伺服器宕機怎麼辦?伺服器故障應急預案
不管是外部攻擊還是內部故障,備份好以及冗餘措施,可以使宕機時間縮短到最低。
備份問題儘管聽起來不可思議,但在實踐中,不少企業並未建立起一套檢驗過的備份系統。備份的意義在於危急時刻可以快速恢復或重建生產系統。在企業網路中,經常出現的問題實際上是:
備份步驟的瑕疵導致並未完成正確的備份過程
由於有限的儲存空間導致一定時間後因儲存空間耗盡導致的隨後備份失敗
備份介質受損導致無法成功恢復
傳統上,磁帶因其低造價以及高儲存密度使其成為了理想的備份介質。然而,這種傳統備份介質的幾個致命缺點經常使其內含的資料變得不可存取:
丟失的磁帶索引卡片
磁帶介質在儲存過程中容易受到外界磁場影響
介質本身損壞
介質讀取過程中被讀取裝置損壞
此外,磁帶備份介質本身儲存在磁帶倉庫中,從倉庫檢索所需的備份磁帶、轉移至資料中心並重新載入資料的時間消耗通常也是客觀的。
即使有一套備份系統仍然是不能抵擋所有的意外事故的。2014 年, Samsung 資料中心的一場大火使其雲服務暫停服務。如果沒有異地備份,這場大火將使其本地備份的恢復變得極為困難。
冗餘對於突發性事件來說,儘快恢復,或者是持續的提供服務是非常重要的。本月,某知名支付公司因資料中心網路連線性故障導致了一段時間的服務中斷。如果有更好的冗餘方案,此種事故的影響面將會得以降低,甚至會化解為使用者不可感知的.內部事故。
大部分伺服器都有兩部獨立的 PSU,任意一部 PSU失效並不會影響其正常服務;一般來說,伺服器的兩部 PSU 將連線到兩路不同的電路或不間斷電源上以避免市電失效;資料中心電源多數同時配備 UPS 和柴油發電機來避免發電公司未通知的停止供電服務導致的服務中斷。網路亦然;同時接入多路 ISP 線路,並對其進行獨立佈線,同時在多條線路上宣告地址,便可使得網路服務的魯棒性更高。
在系統的視角上,只有同時配置好的備份以及冗餘方案,才能提高可用性,避免非可控因素導致的長時間服務中斷。
伺服器宕機怎麼辦?伺服器故障應急預案就為大家介紹到這裡