检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GaussDB(DWS)添加云监控服务的告警规则时会话数阈值如何设置? 连接数据库后,执行以下SQL语句可以查看当前全局最大并发会话数。 1 show max_active_statements; 进入到云监控界面,根据查出的全局最大并发会话数,取70%-80%为阈值即可。例如,查询到max_acti
磁盘监控告警阈值太低,告警频繁 问题现象 DWS集群磁盘使用率达到80%就出现告警,告警频繁。 原因分析 集群配置的告警监控阈值不合理。 处理方法 可在GaussDB(DWS)管理控制台设置告警的触发条件,指定达到磁盘使用率、告警持续时间及告警频次。 集群磁盘使用率达到90%就会
告警策略触发条件以用户实际配置为准。 表1 DMS告警源触发阈值告警 告警类别 告警名称 告警级别 告警描述 默认 DWS集群节点CPU使用率超阈值 紧急 DMS告警模块在指定周期内,检测到集群任意节点的CPU使用率(系统+用户)超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警
s(可配置),则上报节点数据盘时延超阈值告警;如果平均使用率低于400ms,则消除告警。 如果节点数据盘时延一直大于上报阈值,那么在24小时(可配置)后将再次发起告警。 告警属性 告警ID 告警归属 告警级别 告警类型 业务类型 是否可自动清除 DWS_2000000012 管理面
上报集群的SQL探针耗时超阈值的紧急告警;如果所有SQL探针执行耗时不超过该阈值,则消除该紧急告警。 如果存在SQL探针耗时一直大于上报阈值,那么在24小时(可配置)后将再次发起告警。 告警属性 告警ID 告警归属 告警级别 告警类型 业务类型 是否可自动清除 DWS_2000000020
根据实际集群的使用情况,进入“监控 > 告警 > 告警规则管理”界面。 在“节点CPU使用率超阈值”规则所在行“操作”列单击“修改”,进入“修改告警规则”界面。 调整告警阈值和检测周期配置项,其中上报阈值越大、检测周期越长,则告警的灵敏度越低;否则灵敏度越高。更详细的界面配置说明参考告警规则。
则上报节点数据盘使用率超阈值的重要告警;如果平均使用率低于75%(即上报阈值减去5%),则消除该重要告警。 如果存在磁盘最近10分钟(可配置)内的最大使用率超过85%(可配置),则上报节点数据盘使用率超阈值的紧急告警;如果平均使用率低于80%(即上报阈值减去5%),则消除该紧急告警。
DWS集群查询语句堆积数量超阈值。 类型 操作告警。 发生时间 告警发生时间。 附加信息 集群ID 集群resourceId、domain_id等详细信息。 对系统的影响 SQL查询阻塞,导致运行时间过长。 可能原因 业务执行过程中查询语句处于排队等待的数量超过告警阈值。 处理步骤 确认集群当前排队作业情况是否正常
检查查询语句触发下盘量超阈值告警的配置是否合理。 登录GaussDB(DWS)管理控制台,进入“监控 > 告警 > 告警规则管理”界面。 在“查询语句触发下盘量超阈值”规则所在行“操作”列单击“修改”,进入“修改告警规则”界面。 如果集群磁盘容量配置较高,可以考虑将上报阈值调大,建议不超过单个数据盘容量的5%。
平均使用率超过90%(可配置),则上报节点数据盘I/O利用率超阈值告警;如果平均使用率低于85%(即上报阈值减去5%),则消除告警。 如果节点数据盘I/O利用率一直大于上报阈值,那么在24小时(可配置)后将再次发起告警。 基于SSD盘存储的集群,在业务量增多的情况下,磁盘I/O可
使用率。如果某节点的动态内存使用率超过90%(可配置),则上报节点动态内存使用率超阈值告警;如果平均使用率低于85%(即上报阈值减去5%),则消除告警。 如果节点动态内存的平均使用率一直大于上报阈值,那么在24小时(可配置)后将再次发起告警。 告警属性 告警ID 告警归属 告警级别
使用率。如果某节点的实例内存使用率超过90%(可配置),则上报节点实例内存使用率超阈值告警;如果平均使用率低于85%(即上报阈值减去5%),则消除告警。 如果节点实例内存的平均使用率一直大于上报阈值,那么在24小时(可配置)后将再次发起告警。 告警属性 告警ID 告警归属 告警级别
监控设置 监控设置页面展示了监控指标的采集周期。 集群监控开关按钮默认开启。 当集群处于修复过程中时应该先关闭集群监控开关。当修复完成后,再开启集群监控服务。 当集群中有节点下电或集群管理IP网络不通时,集群监控开关和集群采集指标配置按钮不可用。 监控采集 登录GaussDB(DWS)
告警规则 概述 阈值告警相关概念: 告警规则:告警规则由告警规则名称,告警规则描述,规则绑定集群列表,告警策略触发关系,告警策略项构成。一条告警规则可绑定某个指定集群或所有集群,拥有一个或多个告警策略。其中,告警策略之间组合关系由“策略触发关系”选项描述。告警规则的阈值触发和抑制条件由每条告警策略描述。
LOG_BLCKSZ。 如果设置为其他值,当小于8时,会被默认设置为8;当大于2048的时,会被强制设置为2048。 默认值:256MB 设置建议:每次事务提交时,WAL缓冲区的内容都写入到磁盘中,因此设置为很大的值不会带来明显的性能提升。如果将它设置成几百兆,就可以在有很多即时
LOG_BLCKSZ。 如果设置为其他值,当小于8时,会被默认设置为8;当大于2048的时,会被强制设置为2048。 默认值:256MB 设置建议:每次事务提交时,WAL缓冲区的内容都写入到磁盘中,因此设置为很大的值不会带来明显的性能提升。如果将它设置成几百兆,就可以在有很多即时
导入行数,从而可以在CN计算倾斜率。 使用方法 设置参数(表倾斜告警阈值table_skewness_warning_threshold和表倾斜告警最小行数table_skewness_warning_rows)。 表倾斜告警阈值取值范围0~1,默认值为1,即关闭状态,取其他值时为开启状态。
数进行设置,当前推荐设置为20MB。 此设置将直接对build的进行速度和完成时间产生影响,不建议设置过低(10MB以下不建议)。在业务低峰时,建议及时取消限制,恢复build的正常速度。 该参数可在业务高峰期或主机磁盘IO压力较大场景时,通过限制备机build的流速阈值以减少对
数进行设置,当前推荐设置为20MB。 此设置将直接对build的进行速度和完成时间产生影响,不建议设置过低(10MB以下不建议)。在业务低峰时,建议及时取消限制,恢复build的正常速度。 该参数可在业务高峰期或主机磁盘IO压力较大场景时,通过限制备机build的流速阈值以减少对
b和gtm上设置为相同的模式,否则会出现业务报错无法执行的问题。 GTM-Free模式可以通过enable_gtm_free = on或gtm_option = gtm-free的任一方法开启。 设置非GTM-Free模式时,enable_gtm_free 必须设置为off。 G