检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何启用NGINX stub_status模块? Nginx Prometheus Exporter是通过Nginx的stub_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,以root权限
如何设置全屏模式在线时长? 为保障客户信息的安全性,AOM提供了在线超时退出机制,即:登录控制台后,打开任意一个界面,如果在1小时内无任何操作,则会自动退出到登录界面。 当在使用AOM的全屏模式(包括运维概览全屏模式和仪表盘全屏模式)进行监控时,全屏模式会随着用户账号的退出而退出
您可以进入AOM的容器监控页面,在工作负载的监控视图里查看服务在各个时间的状态值,0代表正常,非0代表异常。 父主题: 常见使用问题
告警管理 如何区分告警和事件?
其他常见问题 AOM 1.0与AOM 2.0使用对比 AOM与APM有何区别? AOM的日志服务与LTS的日志服务有何区别? 如何创建委托apm_admin_trust? 为什么需要创建连接通道?
如何创建委托apm_admin_trust? 创建委托apm_admin_trust 登录IAM控制台。 在左侧导航栏,单击“委托”,进入委托页面。 单击右上角“创建委托”,进入创建委托页面。 参考表1设置创建委托的参数。 表1 创建委托 名称 说明 样例 委托名称 标识该委托代
如何将Prometheus数据接入到AOM? 将Prometheus数据接入到AOM。具体的操作步骤如下: 创建Prometheus实例。 根据需要参考对应的创建操作,具体请参见:管理Prometheus实例。 将原生Prometheus的指标通过Remote Write地址上报
如何获取Prometheus实例的服务地址? 用户可以登录AOM控制台,进入Prometheus实例的详情页面,获取Prometheus实例的服务地址。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”,在实例列表中单击已创建的Prometheus实例的实例名称。
例如,设置连续周期为“2”,则表示连续2个周期不满足告警条件,恢复告警。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。默认只监控一个周期,最多可监控5个连续周期指标数据。 系统处理方式包括:超限阈值并发送告警、数据不足并发送事件、保持上一个状态、正常并发送清除告警。
安装文件包提示没有OBS权限怎么办? 定时任务无法成功触发 编排好的作业,能否在执行时再选择执行机,填入脚本参数等内容? 使用cron表达式创建定时任务,提示参数错误 如何为执行方案配置审批? 执行清理磁盘任务时,提示 delete success:{},未成功删除已选择目录下的文件 编辑作业后,作业的执行方案未更新
常情况下上报的信息,告警会引起业务异常,您需要对告警进行处理。 事件 事件是指AOM、ServiceStage、CCE、APM等服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您不用对事件进行处理。 告警清除 告警清除方式包括自动清除和手动清除两种。 自
AK/SK错误或ECS委托设置错误等原因导致,请获取正确的AK/SK或正确设置ECS委托后重新安装。如果还未安装成功,则请提交工单处理,操作详见如何提交工单。 在AOM界面监控ECS。 ICAgent安装成功后等待1~2分钟左右,您在左侧导航栏中选择“总览 > 监控概览”,即可在
卸载后重新安装。 离线 AK/SK配置不正确或30200、30201端口未连通,处理操作详见如何处理界面“ICAgent状态”为“离线”的问题。 异常 主机ICAgent功能异常,请联系技术人员处理。 可能原因二:AOM不支持监控当前资源类型 修复建议:请检查您的资源是否为AOM
建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维
如何区分Prometheus监控功能采集的基础指标和自定义指标数据? 用户可以登录AOM控制台,进入Prometheus实例的详情界面,通过查看Prometheus监控功能采集的指标数据类型,区分基础指标和自定义指标。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控
根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。 1 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警” 告警标签 单
维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
义通知消息配置。 支持创建告警降噪策略。告警降噪策略分为路由分组、去重、抑制、静默四部分,作用于发送告警通知之前对告警按照策略规则链条进行处理,通过所有规则后,再发送通知。 2021-08-20 支持AOM日志接入LTS 通过添加接入规则,可以将AOM中的CCE或自定义集群的日志
ICAgent管理(华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
安装ICAgent(华为云主机) ICAgent用于采集指标、日志和应用性能数据。对于在ECS、BMS控制台直接购买的主机,您需手动安装ICAgent。对于通过CCE间接购买的主机,ICAgent会自动安装,您不用安装ICAgent。 安装前提 在进行ICAgent安装前,需要先