检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
AOM提供告警规则和事件规则设置功能。通过创建指标、日志和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 功能说明 指标告警规则 通过指标告警规则可对资源的指标设置阈值条件
回填所选的文件包版本中的文件来源,参见表1。 平台 文件包运行的平台,目前仅支持Linux。 脚本类型 操作类型选择“安装”,脚本类型为“安装脚本”。前置脚本对话框中展示前置脚本的内容信息,安装脚本对话框中展示安装脚本的内容信息,最多可以展示1000个字符。 操作类型选择“卸载”,脚本类型为“卸载脚本
M等外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您不用对事件进行处理。 阈值规则 阈值规则:对资源的指标设置阈值条件,当指标数据满足阈值条件时,会产生阈值告警(阈值告警即由阈值规则触发而产生的告警);当没有指标数据上报时,会产生数据不足事件(数据
消息模板的描述信息,最多可输入1024个字符。 消息模板类型 消息模板的类型,当前支持“指标或事件模板”和“日志模板”类型。 企业项目 所属的企业项目。 如果在全局页面设置为“ALL”,此处请从下拉列表中选择企业项目。 如果在全局页面已选择企业项目,则此处灰化不可选。 选择语言,当前仅支持选择中文简体和英文。
本示例可不填写。 - 分组条件 根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。 告警源:触发告警或事件的服务名称。可以设置为AOM 、LTS、CCE等服务名称。 告警级别+等于+紧急、重要
如何调用API 构造请求 认证鉴权 返回结果
通用户权限(无实例创建、修改、删除、扩容、转储)。 在“设置最小授权范围”页签设置授权范围方案为“指定区域项目资源”,并在下方“项目[所属区域]”选定生效区域。 单击“确定”,委托关系创建成功。 后续操作 数据订阅规则设置完成后,AOM会将数据发到配置的“分布式消息DMS”或“W
超过后希望暂停日志收集,可以在配置中心进行设置。 登录AOM 2.0控制台。 在左侧导航栏选择“设置”,进入全局配置界面。 在左侧导航栏选择“日志设置”,单击“配额设置”页签。 登录LTS控制台。 在左侧导航栏选择“配置中心”。 配额设置 分词配置 通过配置分词可将日志内容按照分
资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust? 如何通过创建委托获取AK/SK
如何获取AK/SK? 每个用户最多可创建2个访问密钥(AK/SK),且一旦生成永久有效。 AK(Access Key ID):访问密钥ID,是与私有访问密钥关联的唯一标识符。访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):与访
如何获取AK/SK? 每个用户最多可创建2个访问密钥(AK/SK),且一旦生成永久有效。 AK(Access Key ID):访问密钥ID,是与私有访问密钥关联的唯一标识符。访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):与访
均值>0.5”,“触发条件”设置为“连续周期 3”,“告警级别”设置为,表示监控对象连续3个周期平均值大于0.5时,生成紧急告警。 图3 设置告警规则详情 单击“高级设置”,设置检查频率、告警恢复等信息。本示例可保持系统默认设置。 设置告警通知策略。告警通知策略有两种方式,如图4所示,此处选择直接告警方式。
标,可以按如下方案设置: 告警条件a的指标设置为“aom_node_cpu_used_core”,其余参数采用默认设置。该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上
Host”中,将“region”的“字段类型”设置为“变量”,“字段值”选择“region”。 图15 设置region 在“配置动作 > Path”中,将“projectId”的“字段类型”设置为“表达式”,“字段值”设置为全局变量“projectId”。 图16 设置projectId “转换器
全局设置 授权AOM访问其他云服务 管理AccessCode 配置AOM全局开关 配置AOM菜单开关 订阅AOM指标或告警数据 日志设置
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能
如何启用NGINX stub_status模块? Nginx Prometheus Exporter是通过Nginx的stub_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,以root权限
统计周期为“1分钟”,检测规则设置为“平均值>1”,触发条件为连续周期“3”,告警级别为“紧急”,表示连续三个统计周期,指标的平均值大于已设置的阈值1时,生成紧急告警。 单击“高级设置”,设置检查频率、告警恢复等信息。本示例可保持系统默认设置。 设置告警通知策略。具体参数说明请参见表2。
配置指标存储时长 本节介绍如何配置云服务、ECS、CCE、 多账号聚合实例、APM、通用实例与default类型Prometheus实例的指标存储时长。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 约束与限制 当前配置指