一、监视集群
每个节点可以有不同的集群视图。没有集中化监视节点。为了追踪问题的来源,您必须独立监控每个节点。
许多变量的值取决于您查询的节点。例如,从节点发送的复制和由所有其他节点接收的写入。
从所有节点获取数据可以帮助您了解流消息的来源,哪个节点发送过大的事务,等等。
二、手动监视
手动集群监控可以使用myq-tools来执行 。
1、警报
除了标准的MySQL警报之外,您至少应该使用以下特定于Percona XtraDB集群的触发器:
每个节点的集群状态
wsrep_cluster_status !=Primary
Primary节点状态
wsrep_connected != ON
wsrep_ready != ON
有关其他警报,请考虑以下状态变量:
过大的复制冲突:
wsrep_local_cert_failures
wsrep_local_bf_aborts
过多的流量控制消息
wsrep_flow_control_sent
wsrep_flow_control_recv
大复制队列
wsrep_local_recv_queue。
2、度量
用于长期制图的集群度量收集应至少针对以下内容进行:
队列大小:
wsrep_local_recv_queue
wsrep_local_send_queue
流量控制:
wsrep_flow_control_sent
wsrep_flow_control_recv
节点的事务数量:
wsrep_replicated
wsrep_received
以字节为单位的事务数量:
wsrep_replicated_bytes
wsrep_received_bytes
复制冲突:
wsrep_local_cert_failures
wsrep_local_bf_aborts
三、参考链接:
https://www.percona.com/doc/percona-xtradb-cluster/LATEST/manual/monitoring.html