GKE 1.16.9 Prometheus, grafana per pod details not working?
我有一个运行kubernetes 1.16.9的GKE集群。我正在尝试使用Prometheus和Grafana使监视系统正常工作。
我正在使用的仪表板是标准的" Kubernetes集群监视"
https://grafana.com/grafana/dashboards/315
尽管导入它,但看不到各个容器的CPU /内存使用情况,只看到"值":
我有另一个集群,使用kubernetes 1.15几乎具有相同的设置,并且仪表板可以完美显示每个Pod和每个Pod的用法。
为什么会这样?我对理解Prometheus / grafana以及所有这些如何协同工作还很陌生。
什么可能导致此问题?指标正在显示,并且kubectl顶部窗格显示了...所以我认为metrics-server运行良好...
有关尝试调试此方法的任何提示吗?
您并不孤单。事情是这样的:来自kubelet的
中被删除。
Removed metrics
Removed cadvisor metric labels pod_name and
container_name to match instrumentation guidelines. Any Prometheus
queries that match pod_name and container_name labels (e.g. cadvisor
or kubelet probe metrics) must be updated to use pod and container
instead. (#80376, @ehashman)
依上述规定-
必须将与
非常类似的问题供您参考-Grafana仪表板未显示容器名称,而是显示了pod_name
顺便说一句,您尝试过这个吗? https://grafana.com/grafana/dashboards/11143