检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
访问特定子项目中资源,使得资源的权限控制更加精确。 图1 项目隔离模型 同样在我的凭证下,您可以查看项目ID。 企业项目 企业项目是项目的升级版,针对企业不同项目间资源的分组和管理,是逻辑隔离。企业项目中可以包含多个区域的资源,且项目中的资源可以迁入迁出。 关于企业项目ID的获取
其中{region_name}和{version}均可在安装界面获取: region_name:指定承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同。 Site domain name suffix :站点域名后缀,例如“myhuaweicloud.com”。 version:当前所安装的Uniagent的版本。
请参见分组规则。 图4 设置告警降噪方式 单击“立即创建”,完成创建。如下图所示,创建了一条事件类告警规则。 该规则监控对象为AOM服务的紧急告警事件,当服务事件满足已设的通知策略时,系统就会以邮件、短信等方式发送告警通知给指定人员。 图5 事件类告警规则 更多事件类告警规则操作
给租户下某个CCE集群安装ICAgent √ x 给租户下某个CCE集群升级ICAgent √ x 给租户下某个CCE集群卸载ICAgent √ x 获取CCE集群列表 √ √ 获取ICAgent机器列表 √ √ CCE集群机器安装ICAgent √ x CCE集群机器升级ICAgent √ x CCE集群机器卸载ICAgent
内核占用率。 检测规则设置为“最大值>0.2”。 触发条件设置为“连续周期:3” 告警级别设置为“紧急”。 当连续3个统计周期,主机CPU内核占用率的最大值大于0.2时,则触发紧急告警。 指标 需要监控的指标。通过“全量指标”方式选择指标时,仅支持英文展示和英文搜索。 单击“指标
URI-scheme:表示用于传输请求的协议,当前所有API均采用HTTPS协议。 Endpoint:指定承载REST服务端点的服务器域名或IP,不同服务不同区域的Endpoint不同,您可以从地区和终端节点获取。 例如IAM服务在“华北-北京一”区域的Endpoint为“iam
察的开关,详细操作请参见菜单开关。 如果需要将CCE的工作负载上报到AOM中,并挂载到“应用监控”页面左侧的应用树中以组件形式体现,需要先升级工作负载。具体操作如下: 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“工作负载 ”,选择需要上报到AOM的工作负载类型。
${domain_name} 通知类型 创建通知规则时选择的类型:告警或事件 ${event_type} 事件级别 创建通知规则时选择告警或事件级别:紧急、重要、次要、提示 ${event_severity} 事件名称 触发通知规则的告警或事件的名称 $event.metadata.event_name
内核占用率。 检测规则设置为“最大值>0.2”。 触发条件设置为“连续周期:3” 告警级别设置为“紧急”。 当连续3个统计周期,主机CPU内核占用率的最大值大于0.2时,则触发紧急告警。 指标 需要监控的指标。通过“全量指标”方式选择指标时,仅支持英文展示和英文搜索。 单击“指标
警发送频率不生效,统一按告警降噪中设置的频率发送告警通知。 立即触发:满足筛选条件立即触发告警。 告警级别:事件告警的级别,包括: :表示紧急告警。 :表示重要告警。 :表示次要告警。 :表示提示告警。 选择多个事件的场景下,单击“批量编辑”,可为当前选择的所有事件批量设置告警条件。
、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。 表1 搜索条件说明 搜索条件 搜索条件说明 设置样例 告警级别 支持选择如下告警级别进行搜索: 紧急 重要 次要 提示 告警级别:重要,即可查询出指定时间范围内告警级别为“重要”的告警。 资源类型 支持选择资源类型别进行搜索。 资源类型:
值组成。例如,统计周期为“1分钟”,检测规则设置为“平均值>1”,触发条件为连续周期“3”,告警级别为“紧急”,表示连续三个统计周期,指标的平均值大于已设置的阈值1时,生成紧急告警。 单击“高级设置”,设置检查频率、告警恢复等信息。 设置告警通知策略。告警通知策略有两种方式,如图6所示,此处选择直接告警方式。
x 暂停周期性转储 √ x 创建统计规则 √ x 修改统计规则 √ x 删除统计规则 √ x 配置分词 √ x 安装ICAgent √ √ 升级ICAgent √ x 卸载ICAgent √ x 使用自定义细粒度策略,请使用管理员用户进入统一身份认证(IAM)服务,按需选择AOM的
建规则。 下面以监控ELB业务层全量指标为例说明。 前提条件 已创建告警行动规则。 步骤一:创建分组规则 创建一个分组规则,当产生AOM的紧急、重要告警时,触发“Monitor_host”行动规则,且告警按照告警源合并分组。 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理
卷扩容失败事件,则每5分钟发送一次告警通知直到告警被清除。 立即触发:满足筛选条件立即触发告警。 告警级别 事件告警的级别,包括: :表示紧急告警。 :表示重要告警。 :表示次要告警。 :表示提示告警。 设置完成,单击“确定”。 (可选)为CCEFromProm服务新增PromQL告警规则。
值85时,生成阈值告警。 将光标移动至告警条件上方的图表区,会浮动显示当前指标的ID、IP、单位等信息。 告警级别 阈值告警的级别,包括:紧急、重要、次要、提示。 高级设置 告警恢复 监控周期内监控对象不满足触发条件时,则恢复告警。默认只监控一个周期,最多可监控5个周期指标数据。
发送告警通知的告警行动规则名称。 ${action_rule} 触发时间 触发此告警或事件的时间。 ${starts_at} 触发级别 创建告警规则时选择告警或事件级别:紧急、重要、次要、提示。 ${event_severity} 告警内容 详细的告警信息说明。 ${alarm_info} 资源标识 触发告警或事件对应的具体资源。
指定类型为application/json。 region 是 String Prometheus实例所属Region,一般为承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同。 表3 请求Body参数 参数 是否必选 参数类型 描述 prom_name 是 String Prometheus实例名称