检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
type为autoscaling时,列表必须为[]。 说明: 若要使Auto Scaling告警规则生效,必须绑定伸缩策略,具体操作请参考创建弹性伸缩策略。 若alarm_action_enabled为true,对应的alarm_actions、insufficientdata_
Agent各种状态说明及异常状态处理方法 插件有以下四种状态: 运行中:插件正常运行,监控数据上报正常。 未安装: Agent未安装,安装方法参考《云监控服务用户指南》中的“Agent安装说明”章节。 Agent已经安装,委托未配置,委托配置方法参考如何配置委托?。 Agent已
需要先观察指标的上报周期,策略设置的聚合周期必须大于指标的上报周期,否则无法正常产生告警。 例如:指标上报周期为10分钟一次,那么用户不能创建5分钟的聚合告警策略。 原始值 连续触发次数 当告警连续多少次被触发时,发送告警信息。 连续触发次数可选择连续1次、连续2次、连续3次、连
通过事件监控,对异常事件告警进行处理,保证业务稳定运行。 弹性公网IP事件 当您的弹性云服务器要访问Internet时,您可使用虚拟私有云创建的弹性公网IP绑定到弹性云服务器上,弹性云服务器即可连接公网。不同弹性公网IP还可以共享带宽,减少您的带宽成本。使用弹性公网IP时,可使用
修改、删除、启用、停用数据转储 当业务变化或者之前配置的数据转储配置不符合您的业务需求时,您可参考本章节修改、停用、启用或删除数据转储任务。 修改数据转储任务 登录管理控制台。 单击“服务列表 > 云监控服务”。 在左侧导航树中选择“数据转储”。 单击数据转储任务所在行“操作”列的“修改”,进入“修改转储任务”界面。
将实时监控数据接入自建Prometheus 部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件
修改屏蔽规则 当业务变化或者当前配置的屏蔽规则不符合您的业务需求时,可参考本章节进行修改。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警屏蔽”,进入告警屏蔽界面。 在“告警屏蔽”界面,单击待修改屏蔽规则所在行“操作”列的“修改”。 在“修改
/a-z/A-Z/_/-或汉字。如:ResourceGroup-Test01。 resources Array of objects 是 创建的资源分组选择一个或者多个资源。 详细参数说明请参见表3。 表3 resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace
、10、15、30、60、90、120、180 suppress_duration 否 Integer 告警抑制时间,单位为秒,对应页面上创建告警规则时告警策略最后一个字段,该字段主要为解决告警频繁的问题,0代表不抑制,满足条件即告警;300代表满足告警触发条件后每5分钟告警一次;
Alarm配额不足 The number of alarms exceeds the quota 申请更多的Alarm配额 400 ces.0028 创建告警规则时指标和通知类型不匹配 The metric does not support the alarm action type. 根据参数说明修改指标或通知类型,使二者匹配
Agent一键修复失败问题排查 问题现象 安装主机监控Agent后,单击“修复插件配置”后,插件状态仍然是“配置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /u
告警状态有哪些? 目前云监控服务支持六种告警状态: 告警中、已解决、数据不足、已触发、已失效、已解决(手动)。 告警中:监控指标数值达到告警配置阈值,资源正在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致;
资源分组ID,以rg开头,后跟22位由字母或数字组成的字符串 最小长度:2 最大长度:24 create_time String 资源分组的创建时间 enterprise_project_id String 资源分组归属企业项目ID 正则匹配:^((([a-z]|[0-9]){8}
管理站点监控 操作场景 当业务变化或者当之前配置的站点监控规则不符合您的业务需求时,您可参考本章节修改、停用、启用或删除站点监控。 修改站点监控 登录管理控制台。 单击“服务列表 > 云监控服务 > 站点监控”。 单击监控站点所在行的“更多 > 修改站点监控”,或者则勾选多个监控站点,单击列表上方的“修改”。
的监控指标为cpu_util等,各资源的监控指标名称可查看支持监控的服务列表。 condition Condition object 是 创建自定义告警模板的告警策略。 详细参数说明请参见表4。 alarm_level Integer 否 设置告警级别。值为1、2、3、4。其中1为紧急,2为重要,3为次要,4为提示。
如何导出监控数据? 云监控服务支持导出监控数据,具体操作步骤如下: 用户在云监控服务页面选择“云服务监控”或“主机监控”。 单击“导出监控数据”。 根据界面提示选择“时间区间”、“周期”、“资源类型”、“维度”、“监控对象”、“监控指标”。 单击 “导出”。 一次可选择多个监控指标导出。导出文件格式为“csv”。
invocation_target String 任务对象,目前仅支持telescope 枚举值: telescope create_time Long 任务创建时间 最小值:1111111111111 最大值:9999999999999 update_time Long 任务更新时间 最小值:1111111111111
256}$ 响应参数 状态码: 201 表6 响应Body参数 参数 参数类型 描述 relation_ids Array of strings 创建成功的关联ID列表 数组长度:0 - 100 notification_mask_id String 屏蔽规则ID 状态码: 400 表7
模板类型(custom代表默认自定义模板,system代表系统模板) 枚举值: system custom create_time String 告警模板的创建时间 template_description String 告警模板的描述,长度范围[0,256],该字段默认值为空字符串 状态码: 400
带宽的监控数据没有超限记录但是收到了告警通知 出现此种情况,可能是您的事件监控的告警机制配置的“立即触发”,而带宽的监控数据聚合方式默认为5分钟内的平均值。因此您收到了事件告警的短信通知,但监控数据是正常的。 父主题: 告警