检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据节点级监控 Proxy节点级监控 单机 支持 只有实例级别的监控指标,实例监控即为数据节点监控。 不涉及 不涉及 主备 支持 实例监控是指对主节点的监控。 支持 数据节点监控分别是对主节点和备节点的监控。 不涉及 读写分离 支持 实例监控是指对主节点的监控。 支持 数据节点监控分别是对主节点和备节点的监控。
查看监控指标与配置告警 云监控服务(CloudEye Service)是公有云提供的安全、可扩展的统一监控方案,通过云监控服务集中监控DCS的各种指标,基于云监控服务实现告警和事件通知。 DCS支持的监控指标 DCS常用的监控指标 查看DCS性能监控 配置DCS监控告警
主备切换 功能介绍 切换实例主备节点,只有主备实例支持该操作。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/instances/{instance_id}/swap 表1 路径参数 参数 是否必选 参数类型 描述 instance_id 是
查看DCS性能监控 您可以通过云监控服务集中监控DCS的各种性能监控指标。 查看DCS性能监控 登录分布式缓存服务管理控制台。 在管理控制台左上角单击,选择实例所在的区域。 单击左侧菜单栏的“缓存管理”,进入缓存实例信息页面。 单击需要查看性能监控指标的缓存实例,进入实例基本信息页面。
配置告警(按资源分组) 云监控服务支持资源分组功能,在使用DCS缓存服务时,您可以按照实例级别、数据节点、Proxy节点创建资源分组,从分组角度查管理实例,管理告警规则,可以极大的降低运维复杂度,提高运维效率。资源分组的更多信息,请参考资源分组介绍。 创建资源分组。 登录云监控服务管
Redis监控数据异常处理方法 当对Redis监控数据存在疑问或异议时,可以使用Redis-cli访问Redis实例,执行info all命令,查看进程记录的指标。info all输出详解可参考:https://redis.io/docs/latest/commands/info/。
DCS常用的监控指标 本章节主要列举Redis的常用监控指标。 表1 常用监控指标说明 指标名称 说明 CPU利用率 该指标统计的是每个统计周期(分钟级就是每1分钟,秒级就是每5秒)内的最大值。 如果是单机和主备实例,支持查看实例级别的CPU使用情况。 如果是Proxy集群实例,
用流量超过该实例规格的最大带宽。流控会导致连接被丢弃,从业务角度可能会造成业务的延迟增大,客户端连接异常等问题。 实例规格对应的最大带宽,可以查看实例规格中对应实例类型的“基准/最大带宽”。 带宽使用率不高时,也有可能有限流,因为带宽使用率是上报周期实时值,一个上报周期检查一次。
监控安全风险 DCS提供基于云监控服务CES的资源和操作监控能力,帮助用户对每个DCS实例进行自动实时监控、告警和通知操作。用户可以实时掌握实例的各类业务请求、资源占用、带宽、并发操作数和流控次数等关键信息。 关于DCS支持的监控指标,以及如何创建监控告警规则等内容,请参见监控。
监控告警 Redis实例CPU使用率达到100%的原因 如何查看Redis实例的实时并发连接数和最大连接数 Redis监控数据异常处理方法 监控数据出现实例已使用内存略大于实例可使用内存是什么原因? 为什么带宽使用率指标会超过100% 监控指标中存在已拒绝的连接数是什么原因? 触发限流(流控)的原因和处理建议
查看实际连接数:单击实例名称,进入实例详情页面,选择“性能监控”页签,找到“活跃的客户端数量”监控项查看。 如果客户端连接数已到达连接上限,可以根据需要调整maxclients参数,如果maxclients参数已经是最大可配连接数,仍不满足需求,则需要升级规格。 父主题: 监控告警
为什么带宽使用率指标会超过100% 带宽使用率基本信息如下: 指标ID 指标名称 含义 取值范围 测量对象&维度 监控周期(原始指标) bandwidth_usage 带宽使用率 当前流量带宽与最大带宽限制的百分比 0-200% 测量对象: Redis 4.0及以上版本 主备、读写分离、集群实例数据节点
本信息页面。 单击“性能监控”,页面显示该实例的所有监控指标信息。 您也可以在需要查看的缓存实例的“操作”列,单击“查看监控”,进入云监控服务的页面查看,这和在缓存实例信息页面“性能监控”页签内容一致。 父主题: Redis使用
监控数据出现实例已使用内存略大于实例可使用内存是什么原因? DCS单机和主备实例已使用内存为redis-server进程统计的已使用内存。集群是基于分片机制实现的,集群的已使用内存为各个分片redis-server的已使用内存的总和。 由于开源redis-server内部机制的原
主备和读写分离实例,分片数为1,默认是一个一主一从的双副本架构,支持通过“节点管理”查看分片信息,如果需要手动切换主从节点,请执行切换DCS实例的主备节点操作。 对于有多个从副本的主备实例,还可以通过“节点管理”设置主备切换优先级,或摘除从副本的域名IP(仅当包含多个从副本时支持该操作,摘除域名IP后,通过
主备节点切换期间,业务会发生少于10秒的连接闪断,请在操作前确保应用具备断连重建能力。 主备节点切换时,新的主备关系同步需要消耗较多资源,请不要在业务繁忙时执行该操作。 由于主备之间数据同步采用异步机制,主备节点切换期间可能丢失少量正在操作的数据。 实例主备切换后,IP地址不变,不需要切换客户端连接地址。
排查QPS是否过高 在分布式缓存服务控制台的缓存管理页面,单击实例进入实例详情界面,单击左侧的性能监控,进入性能监控页面,查询实例级别的每秒并发操作数(QPS)。 如果QPS过高,建议优化客户业务或者变更实例规格。不同实例规格支持的QPS请参考实例规格。 查找并禁用高消耗命令 使用了keys
redis实例是不会主动丢失数据的,key丢失一般有这几种情况:1、key过期;2、key被逐出;3、key被删除。 按照顺序进行排查: 查看key是否过期。 查看监控,分析是否会触发键逐出机制。 去服务端分析info查看是否有删除key的操作。 父主题: Redis使用
实例右侧的“查看监控”,进入云监控页面。 图1 查看监控 进入监控页面后,找到“活跃的客户端数量”监控项。您可以单击该监控项的右上角的查看按钮,使用大图模式查看。 在弹出的“活跃的客户端数量”页面,根据需要选择查看的时间段,例如,需要查看10分钟内的连接数,您可以将时间自定义为1
当主节点故障后,连接会有秒级中断、不可用,备节点在15秒到30秒内自动完成主备切换,切换完成后恢复正常访问,无需用户操作,保证业务平稳运行。 故障切换期间,会有连接中断和不可用等情况,需要业务侧客户端具备重连/重试机制。 主备切换完成后,原主节点(已切换为从节点)因故障不会立刻恢复,业务继续访问原主节点会失败,可通过配置Redis