关于kubernetes:GKE 1.16.9 Prometheus,每个吊舱的grafana详细信息不起作用?

GKE 1.16.9 Prometheus, grafana per pod details not working?

我有一个运行kubernetes 1.16.9的GKE集群。我正在尝试使用Prometheus和Grafana使监视系统正常工作。

我正在使用的仪表板是标准的" Kubernetes集群监视"
https://grafana.com/grafana/dashboards/315

尽管导入它,但看不到各个容器的CPU /内存使用情况,只看到"值":
grafana

我有另一个集群,使用kubernetes 1.15几乎具有相同的设置,并且仪表板可以完美显示每个Pod和每个Pod的用法。

为什么会这样?我对理解Prometheus / grafana以及所有这些如何协同工作还很陌生。

working


您并不孤单。事情是这样的:来自kubelet的pod_namecontainer_name标签在1.14中被弃用,而使用pod和container,然后在1.16

中被删除。

Removed metrics

Removed cadvisor metric labels pod_name and
container_name to match instrumentation guidelines. Any Prometheus
queries that match pod_name and container_name labels (e.g. cadvisor
or kubelet probe metrics) must be updated to use pod and container
instead. (#80376, @ehashman)

依上述规定-
必须将与pod_namecontainer_name标签匹配的所有Prometheus查询(例如cadvisor或kubelet探针指标)更新为使用podcontainer代替

非常类似的问题供您参考-Grafana仪表板未显示容器名称,而是显示了pod_name

顺便说一句,您尝试过这个吗? https://grafana.com/grafana/dashboards/11143