-
Prometheus Metric 的實(shí)踐總結(jié),搞定監(jiān)控需注意~
使用 Promethues 實(shí)現(xiàn)應(yīng)用監(jiān)控的一些實(shí)踐 在這篇文章中我們介紹了如何利用 Prometheus 監(jiān)控應(yīng)用。在后續(xù)的工作中隨著監(jiān)控的深入,我們結(jié)合自己的經(jīng)驗(yàn)和官方文檔總結(jié)了一些 Metrics 的實(shí)踐。希望這些實(shí)踐能給大家提供參考。 確定監(jiān)控對象 在具體設(shè)計(jì) Metrics 之前,首先需要明確需要測量的對象。需要測量的對象應(yīng)該依據(jù)具體的問題背景、需求和需監(jiān)控的系統(tǒng)本身來確定。 從需求出發(fā) Google 針對大量分布式監(jiān)控的經(jīng)驗(yàn)總結(jié)出四個監(jiān)控的黃金指標(biāo),這四個指標(biāo)對于一般性的監(jiān)控測量對象都…
-
自從上了 Prometheus,睡覺也踏實(shí)了!
對很多人來說,未知、不確定、不在掌控的東西,會有潛意識的逃避。當(dāng)我第一次接觸 Prometheus 的時候也有類似的感覺。對初學(xué)者來說, Prometheus 包含的概念太多了,門檻也太高了。
-
使用 Thanos 和 Prometheus 打造一個高可用的 Kubernetes 監(jiān)控系統(tǒng)
對于彈性伸縮和高可用的系統(tǒng)來說,一般有大量的指標(biāo)數(shù)據(jù)需要收集和存儲,如何為這樣的系統(tǒng)打造一個監(jiān)控方案呢?本文介紹了如何使用 Thanos+Prometheus+Grafana 構(gòu)建監(jiān)控系統(tǒng)。 集群容量概覽 直到今年 1 月,我一直在使用一款企業(yè)級監(jiān)控解決方案來監(jiān)控 Kubernetes 集群,這款監(jiān)控方案還用于 APM。它用起來很自然,與 Kubernetes 的集成非常容易,只需要進(jìn)行一些細(xì)微的調(diào)整,并且可以集成 APM 和基礎(chǔ)設(shè)施指標(biāo)。 盡管這款監(jiān)控方案可以很容易地收集和存儲數(shù)據(jù),但使用指標(biāo)…