检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
MySQL)的告警规则,包括设置告警规则名称、告警阈值、监控周期和是否发送通知等参数。 操作步骤 登录管理控制台。 在页面左上角单击,选择“管理与监管 > 云监控服务 CES”,进入“云监控服务”信息页面。 在左侧导航栏选择“云服务监控 > 数据库代理”。 单击“数据库代理”看板名称,选择目标实例,单击操作列的“更多
选择目标HTAP实例,单击操作列的“查看监控指标”。 您也可以单击目标HTAP实例名称,进入基本信息页面,在页面右上角,单击“查看监控指标”。 图1 查看监控指标入口 进入“云监控服务”页面查看当前HTAP标准版实例的监控指标。 图2 查看HTAP实例的监控指标 查看FE节点和BE节点的监控指标 在“实例
“实时性能”页面的性能数据默认监控周期为1分钟,您可以单击“秒级监控”,设置联动图表和开启秒级监控。 联动图表:开启联动图标,可以查看同一时刻各指标数据。 秒级监控:秒级监控有助于提高监控精确度,支持1秒/次和5秒/次监控频率。开启秒级监控,将按小时计费。 图3 秒级监控 父主题: 性能监控
慢日志监控中显示存在慢SQL,但日志管理中慢日志页面没有对应慢SQL信息 由于参数“log_slow_admin_statements”在设置为“ON”时,数据库内核会将诸如Binlog Dump GTID、ANALYZE TABLE、OPTIMIZE TABLE等管理类SQL也
作列的“查看监控指标”,查看此节点的监控指标。 您可以查看的性能指标监控时间窗包括:近1小时、近3小时、近12小时、近24小时、近7天。 图1 RegionlessDB监控指标 RegionlessDB集群的监控指标参见表1。 表1 RegionlessDB集群的监控指标 指标ID
exceeded; try restarting transaction 原因分析 查看监控指标“行锁花费时间”,监控到行锁等待时间较长,说明该系统出现过锁冲突的现象。 监控指标详细内容请参考查看监控指标。 登录实例,执行如下SQL,查看系统当前存在的长事务,以及事务持有的行锁信息。
MySQL)实例在空负载下CPU占用说明 GaussDB(for MySQL)实例上包括操作系统进程、mysqld进程、监控进程、增量备份进程等。mysqld进程包含多个线程比如主备通信线程、连接线程、刷新线程等。监控进程负责实时监控实例的状态,增量备份进程负责进行增量数据备份。因此在实例空载情况下,仍然有多个进程和
针对性的优化措施。 资源优化 您可以通过云监控服务监控资源的使用情况,识别空闲资源,寻找节约成本的机会。也可以根据成本分析阶段的分析结果识别成本偏高的资源,然后采取针对性的优化措施。 通过CES查看GaussDB(for MySQL)监控指标,例如CPU、内存、磁盘的使用率,如果
导致实例全量备份和增量备份失败,影响业务的正常使用。 解决方案 请及时排查业务侧连接是否有效,优化实例连接,释放不必要的连接。 云监控服务目前可以监控数据库CPU、内存、磁盘、连接数等指标,并且设置告警策略,出现告警时可以提前识别风险。 父主题: 数据库连接
8分左右开始变慢,应用有超时的报错。 原因分析 查看CPU使用率监控指标,发现在16:08分左右实例的CPU使用率开始飙升到100%,且一直持续在高位线。 图1 CPU使用率 查看QPS、慢SQL数以及活跃连接数监控指标,发现在16:08分左右QPS突增,活跃连接数上涨,最终业务侧有较多的慢SQL产生。
修改Serverless的算力范围。当满足一定的触发条件时,就会自动触发Serverless实例算力变更。 算力变更的触发条件 通过云监控服务监控Serverless实例的CPU使用率、内存使用率。 当满足如下条件中的任何一种,就会自动触发Serverless算力扩容。 “CPU
过各种角度、范围分析成本和用量的趋势及驱动因素。 企业还可以通过成本中心的“成本监控”,及时发现计划外费用,做到成本的可监控、可分析和可追溯。 详细介绍请参见通过成本分析探索成本和使用量、通过成本监控识别异常成本。 父主题: 成本管理
请及时排查业务侧连接是否有效,优化实例连接,释放不必要的连接。 规格偏小,请对数据库进行规格扩容。 云监控服务目前可以监控数据库CPU、内存、磁盘、连接数等指标,并且设置告警策略,出现告警时可以提前识别风险。具体请参考《云监控服务用户指南》。 解决方法 通过内网连接数据库实例。用内网连接,不会出现因为带宽等原因的拥塞。
华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。 图2 资源中心 销售许可证&软件著作权证书 另外,华为云还提供了以下销售许可证及软件著作权证书,供用户下载和参考。具体请查看合规资质证书。 图3 销售许可证&软件著作权证书 父主题: 安全
场景1 慢查询导致CPU升高 问题原因:大量慢SQL导致实例CPU升高,需要优化相应的慢SQL。 排查思路: 查看CPU使用率和慢日志个数统计监控指标。 如果慢日志个数很多,且与CPU曲线吻合,可以确定是慢SQL导致CPU升高。 如果慢日志个数不多,但与CPU使用率基本一致,进一步查看行读取速率指标是否与CPU曲线吻合。
业务侧云数据库GaussDB(for MySQL)实例上以往执行耗时8秒的查询,在11:00后耗时超过30秒。 原因分析 查看查询变慢对应的时间段中,实例CPU监控指标并无飙升情况且使用率一直都较低,因此排除了CPU冲高导致查询变慢的可能。 图1 CPU使用率 分析对应时间段该实例的慢日志,该SQL执
GaussDB(for MySQL)的临时盘主要是用于暂存数据库运行过程中产生的临时表、临时文件、Binlog Cache等。用户可以通过管理控制台实时监控到实例在不同时间段和粒度下的临时盘使用量和使用率,如下图所示: 图1 磁盘使用情况 随着数据库支撑业务的波动, 用户可能会发现临时盘占用率
istio-citadel证书机制导致每隔45天出现断连 场景描述 业务侧发现数据库每隔45天同一时间,多台数据库实例的连接数骤降。查看服务端连接数监控指标如下: 客户端出现大量报错如下: 原因分析 排查业务侧是否有间隔45天的定时任务。 客户端如果使用了istio等证书加密机制,分析证书
图2 查询慢SQL 查看慢查询中的表数据量约90GB,数据行数约10亿行,且通过图2中的执行时间可以看出,两个SQL执行了40~50分钟,跟监控中内存增长的时间基本一致,确定是临时表内存不受控导致。 解决方案 升级实例规格,将内存利用率维持在合理范围,防止业务突增导致实例OOM。变
则触发告警。 支持的事件监控以及监控异常的处理建议,请参见事件监控支持的事件说明。 告警规则 该条告警所在告警规则的名称/ID。 最新更新时间 该条告警的最新触发时间。 操作 单击“告警指标”,在右侧弹窗中,查看所选时间段内的指标监控视图。 智能诊断 基于运行数据结合智能算法对