PostgreSQL 实时健康监控 大屏 - 高频指标(服务器)

简介:

标签

PostgreSQL , 大屏指标 , qps , long query , locks , active , idle in transaction , long idle in transaction , 2PC


背景

最关键的一些数据库健康指标,趋势监测。

1 CPU

1,5,15分钟平均负载,超过CPU核数时,较高,需要关注优化或拆库或加资源。

uptime  
 21:29:36 up 36 days, 10:46,  2 users,  load average: 0.00, 0.75, 1.25  

2 IO读写吞吐

man iostat看所有指标含义

iostat -x 1  
Linux 3.10.0-693.2.2.el7.x86_64 (iZbp13nu0s9j3x3op4zpd4Z)       06/13/2018      _x86_64_        (56 CPU)  
  
avg-cpu:  %user   %nice %system %iowait  %steal   %idle  
           0.32    0.00    0.14    0.02    0.00   99.52  
  
Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util  
vda               0.00     0.08    0.03    0.23     1.01     5.63    51.49     0.01   32.23    8.77   35.39   0.64   0.02  
vdb               0.00     1.32    0.03   10.28     9.84  1123.44   219.71     0.14   13.82    7.63   13.84   0.17   0.18  
vdc               0.00     0.39    0.05    1.56     7.25   183.56   237.36     0.00    0.94    1.34    0.93   0.10   0.02  

3 读写IOPS

都来自iostat

4 读写IO响应延迟

都来自iostat

5 block device UTIL

都来自iostat

100%表示BLOCK设备已非常繁忙,需要加资源,比如换SSD。

6 内存

Documentation/filesystems/proc.txt

可用内存

脏页

页表大小

cat /proc/meminfo   
MemTotal:       230943368 kB  
MemFree:         1177172 kB  
MemAvailable:   218722632 kB  可用内存  
Buffers:          559332 kB  
Cached:         222984788 kB  
SwapCached:            0 kB  
Active:         123800268 kB  
Inactive:       99803032 kB  
Active(anon):    1934628 kB  
Inactive(anon):  7540356 kB  
Active(file):   121865640 kB  
Inactive(file): 92262676 kB  
Unevictable:           0 kB  
Mlocked:               0 kB  
SwapTotal:             0 kB  
SwapFree:              0 kB  
Dirty:              2208 kB  脏页  
Writeback:             0 kB  
AnonPages:         59560 kB  
Mapped:          6962900 kB  
Shmem:           9415496 kB  
Slab:            4724068 kB  
SReclaimable:    4567004 kB  
SUnreclaim:       157064 kB  
KernelStack:        8816 kB  
PageTables:        29400 kB  页表大小  
NFS_Unstable:          0 kB  
Bounce:                0 kB  
WritebackTmp:          0 kB  
CommitLimit:    207849028 kB  
Committed_AS:   69435832 kB  
VmallocTotal:   34359738367 kB  
VmallocUsed:      432284 kB  
VmallocChunk:   34359294992 kB  
HardwareCorrupted:     0 kB  
AnonHugePages:         0 kB  
HugePages_Total:       0  
HugePages_Free:        0  
HugePages_Rsvd:        0  
HugePages_Surp:        0  
Hugepagesize:    1048576 kB  
DirectMap4k:      120700 kB  
DirectMap2M:     4073472 kB  
DirectMap1G:    232783872 kB  

6 网络

收发带宽

dstat

dstat  
You did not select any stats, using -cdngy by default.  
----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system--  
usr sys idl wai hiq siq| read  writ| recv  send|  in   out | int   csw   
  0   0 100   0   0   0|  18k 1313k|   0     0 |   0     0 |3183  6612   
  0   0 100   0   0   0|   0     0 | 402B  770B|   0     0 | 414   307   

7 D状态进程数

ps -axo stat|grep -c "D"  
0  

8 硬盘健康状态,SSD剩余寿命

smartctl 或 SSD硬件厂商提供的状态监测软件  

8 服务器硬件错误

如果有内容,需要维修硬件。

cat /var/log/mcelog

9 网卡速率状态变化

观测由于网线或交换机或网卡接口问题导致的速率变化

ethtool eth0
...
ethtool ethn

10 文件系统

1、剩余空间

df -h

2、剩余inode

df -i

参考

《Use PostgreSQL collect and analyze Operation System statistics》

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍如何基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
目录
相关文章
|
存储 关系型数据库 数据库
【赵渝强老师】PostgreSQL的服务器日志文件
本文介绍了PostgreSQL数据库的物理存储结构,重点讨论了服务器日志文件。通过`pg_ctl`命令启动PostgreSQL实例时,使用`-l`参数指定日志文件位置,记录数据库启动、运行及关闭过程中的关键信息。附有相关视频讲解和日志文件示例。
321 0
|
机器学习/深度学习 搜索推荐 算法
推荐系统离线评估方法和评估指标,以及在推荐服务器内部实现A/B测试和解决A/B测试资源紧张的方法。还介绍了如何在TensorFlow中进行模型离线评估实践。
推荐系统离线评估方法和评估指标,以及在推荐服务器内部实现A/B测试和解决A/B测试资源紧张的方法。还介绍了如何在TensorFlow中进行模型离线评估实践。
899 0
|
2月前
|
域名解析 运维 监控
如何检测服务器是否被入侵?解析5大异常指标
本文系统介绍了服务器入侵的五大检测维度:硬件资源、网络流量、系统日志、文件完整性及综合防护。涵盖CPU、内存异常,可疑外联与隐蔽通信,登录行为审计,关键文件篡改识别等内容,并提供实用工具与防护建议,助力运维人员快速发现潜在威胁,提升系统安全防御能力。转载链接:https://www.ffy.com/latest-news/1916688607247077376
257 0
如何检测服务器是否被入侵?解析5大异常指标
|
7月前
|
存储 弹性计算 安全
阿里云服务器ECS实例选购参考:vCPU到云盘IOPS等指标详解
阿里云服务器ECS实例可以分为多种实例规格族,而根据CPU、内存等配置的不同,一种实例规格族又进一步细分为多种实例规格。这些实例规格包含了众多关键的性能指标,如 vCPU、处理器、内存、vTPM、本地存储、网络带宽、网络收发包 PPS、连接数、弹性网卡、云盘带宽、云盘 IOPS 等。深入理解这些性能指标,对于用户在阿里云服务器购买过程中选择最适合自己业务需求的实例规格至关重要。
|
SQL 关系型数据库 MySQL
深入解析MySQL的EXPLAIN:指标详解与索引优化
MySQL 中的 `EXPLAIN` 语句用于分析和优化 SQL 查询,帮助你了解查询优化器的执行计划。本文详细介绍了 `EXPLAIN` 输出的各项指标,如 `id`、`select_type`、`table`、`type`、`key` 等,并提供了如何利用这些指标优化索引结构和 SQL 语句的具体方法。通过实战案例,展示了如何通过创建合适索引和调整查询语句来提升查询性能。
2564 10
|
存储 弹性计算 缓存
阿里云服务器ECS通用型实例规格族特点、适用场景、指标数据解析
阿里云服务器ECS提供了多种通用型实例规格族,每种规格族都针对不同的计算需求、存储性能、网络吞吐量和安全特性进行了优化。以下是对存储增强通用型实例规格族g8ise、通用型实例规格族g8a、通用型实例规格族g8y、存储增强通用型实例规格族g7se、通用型实例规格族g7等所有通用型实例规格族的详细解析,包括它们的核心特点、适用场景、实例规格及具体指标数据,以供参考。
阿里云服务器ECS通用型实例规格族特点、适用场景、指标数据解析
|
存储 弹性计算 安全
阿里云服务器ECS计算型实例规格族特点、适用场景、指标数据参考
阿里云服务器ECS提供了丰富的计算型实例规格族,专为满足不同场景下的高性能计算需求而设计。包括计算型实例规格族c8y、计算型实例规格族c7、计算型实例规格族c8i等热门计算型实例规格,以及网络增强型的c7nex、密集计算型的ic5等其他计算型实例规格,每一种规格族都经过精心优化,确保在计算性能、存储效率、网络吞吐和安全特性等方面达到最佳平衡。本文将详细解析阿里云服务器ECS中的多个计算型实例规格族,包括它们的核心特点、适用场景、实例规格及具体指标数据,为用户在云计算资源选型时提供全面参考。
阿里云服务器ECS计算型实例规格族特点、适用场景、指标数据参考
|
存储 监控 关系型数据库
监控 PostgreSQL 的性能指标
监控 PostgreSQL 的性能指标
684 3
|
存储 弹性计算 网络协议
阿里云ECS内存型实例规格族特点、适用场景、指标数据参考
阿里云ECS提供了多样化的内存型实例规格族,专为需要高性能内存资源的应用场景设计。从最新的r8a系列到经过优化的re6p系列,旨在提供稳定、高效且安全的计算环境。这些实例不仅具备强大的计算性能与内存配比,还通过支持ESSD云盘和高效网络协议,显著提升了存储I/O能力和网络带宽,适用于大数据分析、高性能数据库、内存密集型应用等多种场景,为用户带来卓越的计算体验。本文将详细解析阿里云ECS中的多个内存型实例规格族,包括它们的核心特点、适用场景、实例规格及具体指标数据,为用户在云计算资源选型时提供参考。
|
Prometheus 监控 Cloud Native
Prometheus结合Consul采集多个MySQL实例的监控指标
将 Prometheus 与 Consul 结合使用,实现对多个 MySQL 实例的自动发现与监控,不仅提高了监控的效率和准确性,也为管理动态扩缩容的数据库环境提供了强大的支持。通过细致配置每一部分,业务可以获得关键的性能指标和运行健康状况的即时反馈,进而优化资源配置,提高系统的稳定性和可用性。
595 3

相关产品

  • 云原生数据库 PolarDB
  • 云数据库 RDS PostgreSQL 版
  • 推荐镜像

    更多