-
老司機親授:請收下這份運維故障處理指南
1.故障處理原則 故障處理的原則只有兩個: 以恢復業務優先 及時升級 1.1?恢復業務優先 恢復業務優先是指,不管在任何情況下,也不管任何級別的故障,都要先做到恢復業務,這個和故障定位不同,也有很多人會產生歧義,覺得如果不找到問題的根源,如何能恢復業務,下面我舉一個例子說明二者的差別: 如果 A 應用調 B 應用時,調用失敗,這時我們要怎么做? 方法一,排查問題,尋找A到B之間會經過哪些環節,找到其中的出問題的環節,比如HA連接異常,進行重啟或者擴容恢復。 方法二,從A應用的服務器去ping B…