運維工程師有前途么?
就目前市面上來說,只會單純的Linux傳統運維可能薪資相對較低,有很多人在唱衰運維這個崗位,但是事實并非如此。
目前市面上運維工程師大致可以分為兩個群體:傳統運維、互聯網運維,具體的工作職能可以看下圖。
簡單的將目前運維發展歷史分為3個階段:
1.石器時代2013/05-2014/02
規模:
- 服務器:100臺
- 流量:PV小于3000萬
- 團隊:<50研發,2個運維
問題:
- 安全問題
- 機房資源不足
- 監控:性能 | 維護成本
- 部署:手工操作,依賴于人
- DB壓力
- 流突徒增
2.青銅時代2014/03-2015/04
規模?:
- 服務器∶>2000臺
- 流量∶ PV大于5億。
- 業務∶出租車、專車
- 團隊∶>300個研發,8個運維
問題?:
(1)監控的問題
- 性能
- 維護成本
- 有效性
(2)部署的問題:
- 增量
- 業務個性需求。
- 迭代過快的變更沖突·
- 非靜態文件·
- 數據的問題
(3)業務同質化嚴重、迭代需求多
(4)業務擴容效率低
(5) 配置管理,關聯關系
3.黑鐵時代?2015/05?
規模:
- 服務器∶ >1w臺
- 流量∶ PV大于50億
- 業務∶10多個業務
- 團隊∶ >1000個研發,25個運維
問題:
(1)過多的業務需求導致運維人力無法及時有效響應
(2)監控:有效性、覆蓋率、監控指標量化
(3)部署:
- 多集群部署需求
- 部署接入耗時過長
- 擴容效率
(4)預案管理
(5)成本問題
傳統運維弊端:
傳統運維架構弊端: 生產環境的CPU或者資源利用率 18%
1、架構層次過多,排查問題較為困難 1.2-1.5倍 *2
2、擴展性弱,無法快速做到彈性收縮
3、資源浪費嚴重,為了高可用,許冗余大量服務 KVM
4、架構重構性差,一旦成型,很難做調整
5、發布流程繁瑣,很容易引起用戶體驗問題
6、運維經常救火,搞不好就要背鍋 2-3點
7、監控做的粗糙,一深入業務就不好定位
就目前來說,傳統運維沖擊年薪30W+的轉型方向就是SRE&DevOps崗位。
大型互聯網SRE&DevOps運維核心在于:(也可以看作是一份學習路線圖)
可觀測性系統:
指標監控:即各種指標監控,比如基礎資源指標,服務性能指標,業務的調用指標。
日志:各種設備以及服務的運行日志監控。 ELK
調用鏈:業務層面的調用鏈分析,通常在分布式系統中幫助運營、開發以及運維人員快速識
別整體調用的瓶頸點
故障響應:及時性、準確性、自愈性 AIOPS 500-800條
CI/CD可集成和部署發布:
容量規劃與彈性收縮:
1、當前的容量是多少
2、何時達到容量極限
3、應該如何更改容量
4、執行容量規劃
運維自動與平臺化:
容器編排與微服務、服務網格
分享一下大型互聯網公司運維核心架構圖:
此外,微服務容器云方面技術也是當下運維工作需要掌握的