监控告警项说明
概述
Rainbond 监控服务由组件 rbd-monitor
完成,在 monitor 组件中采用 Sidecar 设计模式思想整合 Prometheus 服务,并基于 ETCD动态发现 需要监控的 targets,自动配置与管理 Prometheus 服务。monitor 会定期到每个 targets 刮取指标数据,并将数据持久化在本地,提供灵活的PromQL查询与RESTful API查询。
架构图:

访问方式
默认监听端口9999,默认安装已添加 Service 对象,在集群获取到 ServiceIP
后在平台添加 第三方服务 打开对外端口即可访问。
获取 ServiceIP
方式
$ kubectl get service rbd-monitor -n rbd-system
NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE
rbd-monitor ClusterIP 10.68.140.5 <none> 9999/TCP 7h11m

具体监控报警项请访问 rbd-monitor 查看,以下仅作为参考。
监控项
节点资源监控项
监控项 | 所属组件 | 说明 |
---|---|---|
cadvisor_version_info | cadvisor | 节点系统信息 |
machine_memory_bytes | cadvisor | 当前主机内存大小 |
machine_cpu_cores | cadvisor | 当前节点CPU数目 |
node_filesystem_size | node | 存储 |
node_load1 | node | 负载1m |
node_load5 | node | 负载5m |
node_load5 | node | 负载15m |
node_memory_MemTotal | node | 节点内存total |
node_memory_MemFree | node | 节点内存free |
node_uname_info | node | 节点信息 |