
Prometheus
一共20篇文章
专题:第期
-
Prometheus监控Ceph集群并设置AlertManager告警
之前写过ceph的搭建,那么我们ceph同样也需要prometheus进行监控数据。我这里使用prometheus监控ceph并配置alertmanager告警... 新闻联播老司机- 1.2k
- 1
-
Prometheus Blackbox域名SSL证书监控并设置AlertManager告警
blackbox exporter 是prometheus社区提供的黑盒监控解决方案,运行用户通过HTTP、HTTPS、DNS、TCP以及ICMP的方式对网络进行探测(主动监测主机与服务状态)。... 新闻联播老司机- 2.2k
- 0
-
Prometheus Grafana使用Ceph持久化并监控k8s集群
随着时间的更新,早期写过的Promethues监控k8s和grafana这一块文章已经有需要修改的地方。并且以前使用nfs为pod进行持久化,本地修改为使用ceph进行持久化,版本也进行更新迭代... 新闻联播老司机- 885
- 0
-
Prometheus 监控VMware_ESXI并配置AlertManager告警
目前grafana流行的模板都是通过InfluxDB为数据源,使用Telegraf来收集数据。为了统一管理,找了很久的prometheus数据源。来对接VMware_exporter... 新闻联播老司机- 3.3k
- 0
-
解决Grafana Node_exporter网卡流量监控不准确
最近服务器添加监控和报警后,发现服务器网卡流量监控不准确。因为我服务本身就10M带宽,但是这里的上行和下行带宽竟然高达30M。这里的模板我使用的是大家用的比较多的8919模板 搭建文档可以参考 问题分析 首先我这里将grafana的出图语句复制下来进行分析 我们复制监控项的语句到Prometheus上进行查看 我没有添加任何规则,发现获取的网卡流量包含docker、lo以及eth的流量 解决问题 …... 新闻联播老司机- 1.3k
- 0
-
AlertManager 微信告警配置
prometheus的告警管理分为两部分。通过在prometheus服务端设置告警规则, Prometheus服务器端产生告警向Alertmanager发送告警信息。最后由alertmanager进行告警... 新闻联播老司机- 2.2k
- 2
-
Prometheus 监控MySQL数据库
由于个人博客目前没有监控,这里使用node_exporter监控系统,同时使用mysqld_exporter监控数据库。后面会添加nginx流量的监控。 除了node_exporter非容器运行,其他的项目均使用容器运行。 本次文档没有介绍数据库安装,有需要的自行百度~ 后面将会添加alertmanager监控告警~ 所有组件版本均使用最新版,并且将版本永久保存,以保证文章时时可用!... 新闻联播老司机- 3.9k
- 0
-
Prometheus Operator 修改数据存储时间
前面说了prometheus operator持久化的问题,但是还有一个问题很多人都忽略了,那就是prometheus operator数据保留天数,根据官方文档的说明,默认prometheus operator数据存储的时间为1d,这个时候无论你prometheus operator如何进行持久化,都没有作用,因为数据只保留了1天,那么你是无法看到更多天数的数据... 新闻联播老司机- 4.3k
- 0
-
Prometheus Operator 持久化存储
因为Prometheus operator默认情况下没有将数据持久化存储,当Pod被删除或者意外重启后,可能会造成数据丢失。... 新闻联播老司机- 3.6k
- 0
-
Prometheus Operator 监控ETCD集群
现在我们需要自定义Prometheus operator,这里以监控ETCD为例。由于我们的etcd是跑在kubernetes外部的,想要监控到,本文章主要介绍k8s二进制安装监控etcd,由于是二进制安装我们需要手动的创建Endpoints以及Service。... 新闻联播老司机- 2.2k
- 0
-
Prometheus Operator 监控k8s组件
默认情况下,prometheus operator已经可以监控我们的集群,但是无法监控kube-controller-manager和kube-scheduler。 这里我们将这2个组件进行监控,并将prometheus和grafana添加traefik。通过ingress进行访问... 新闻联播老司机- 3.6k
- 0