-
IT 運維中的事件、故障排查處理思路
在講解事件、故障處理思路前,先講一個故障場景(以呼叫中心系統作為一例子): 業務人員反映呼叫中心系統運行緩慢,部份電話在自助語言環節系統處理超時,話務轉人工座席,人工座席出現爆線情況。 運維人員開始忙活了,查資源使用情況、查服務是否正常、查日志是否報錯、查交易量還有沒有……時間不知不覺的在敲鍵盤、敲鍵盤、敲鍵盤中過去,但是原因還未定位。 經理過來了解情況:“系統恢復了嗎?”、“故障影響是什么?”、“交易中斷了嗎?”…… 運維人員趕緊敲鍵盤,寫sql,看交易量;敲鍵盤,寫命令,看系統資源、情況………