检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
规则。 查看告警 在已设的监控周期内,当某个资源或资源的指标数据满足告警条件时,产生对应的告警。 可在左侧导航栏中选择“告警管理 > 告警列表”,在“告警”页签下查看该告警,具体请参见查看告警。 查看事件 在已设的监控周期内,当某个资源没有指标数据上报时,会产生一条数据不足的事件。
主机指标及其维度 表1 主机指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_node_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。
设置配置流程。 选择终端节点服务。请从下拉列表选择合适的终端节点服务。 选择的终端节点服务需要和自建Prometheus是同一个VPC。目前仅支持后端资源类型为云服务器、弹性负载均衡类型的终端节点服务。 添加白名单权限。 单击“一键添加至白名单”将AOM提供的账号ID,添加至终端节点服务的白名单中。
AOM仅支持按需计费。 说明: 当处于冻结、受限状态时,无法进行增加、删除、修改Prometheus实例的操作。 欠费后,可能会影响云服务资源的正常运行,请及时充值。有关欠费的详细说明请参见欠费说明。 父主题: Prometheus监控
"Request param is invalid", "trace_id" : "" } 状态码: 404 NotFound 所请求的资源不存在。建议直接修改该请求,不要重试该请求。 { "errorCode" : "SVCSTG.INV.4040000", "errorMessage"
标签用来做汇聚和关联,选择“标签键”,接入后“标签值”自动同步。如果现有标签无法满足需要,可单击“前往标签管理服务(TMS)”进行添加,详细操作请参见添加资源标签。 标签自动同步 开启后,标签值的新增和修改都将同步。 设置完成,单击“立即接入”,则将云服务接入到新创建的云服务类型Prometheus实例中。
名称自动获取。 脚本参数框后的“敏感参数”,勾选后脚本参数框对输入的内容不直接显示。 图4 配置脚本执行任务 选择“目标实例”。单击“添加资源”,弹出选择实例页面。实例类型默认为“ECS”。选择方式默认采用“手动选择”方式,选择方式的详细说明请参见表4。 表4 选择方式说明 选择方式
标数据均上报到AOM分析处理,日志数据则只能匹配系统中最新的日志采集配置。 例如,当前在AOM中配置了ECS主机的日志采集路径,则之前在该资源集下,LTS中所有ECS主机的采集配置都失效。 ICAgent状态说明详见下表。 表1 ICAgent状态 状态 说明 运行 该主机ICAgent运行正常。
代理区域管理 为解决多云之间网络互通,需要在华为云购买和配置ECS主机为代理机,同时代理机上需要绑定公网IP,AOM通过该代理机下发部署控制命令到远程主机,运维数据也将经过该代理机至AOM。代理区是由多个代理机组成,主要是考虑代理机高可用。 代理区域 代理机 父主题: 采集设置
批量操作UniAgent 在主机列表中,可批量对主机的UniAgent进行重装、升级、卸载和删除操作。 如果安装UniAgent的主机是Windows操作系统,则只支持对主机的UniAgent进行升级和删除操作,如需重装和卸载,需手动在主机上执行。 重装UniAgent 当主机的
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。
可以通过本操作设置关键字和时间范围进行日志搜索,详细介绍请参见日志。 基础设施 通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形式来展示资源的指标数据或日志数据,例如,折线图、数字图等,帮助用户全面、深入地掌握监控数据。 详细介绍请参见基础设施。 调用链 在企业微服务之间调用复杂的场景下,APM
None 操作指导 应用运维管理 AOM 创建告警规则(按全量指标创建) 03:45 创建告警规则(按全量指标创建) 应用运维管理 AOM 创建告警规则(按Prometheus命令创建) 04:08 创建告警规则(按Prometheus命令创建) 应用运维管理 AOM 通过虚机接入方式接入中间件指标
M。 表1 AOM 最佳实践一览表 最佳实践 说明 建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 通过告警降噪清除告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对
resource_provider:事件对应云服务名称。类型为String; resource_type:事件对应资源类型。类型为String; resource_id:事件对应资源信息。类型为String。 annotations 否 Map<String,Object> 事件或者告警附加字段,可以为空。
安装UniAgent 对主机安装UniAgent,UniAgent有三种安装方式:Excel导入安装、手动安装和远程安装。 您可以按照您的实际场景进行选择。 表1 安装方式 方式 适用场景 手动安装 首次安装UniAgent时,必须使用手动安装方式。 远程安装 必须有可用的安装机,才可进行远程安装。
运维管理(日落) 安装文件包提示没有OBS权限怎么办? 定时任务无法成功触发 编排好的作业,能否在执行时再选择执行机,填入脚本参数等内容? 使用cron表达式创建定时任务,提示参数错误 如何为执行方案配置审批? 执行清理磁盘任务时,提示 delete success:{},未成功删除已选择目录下的文件
输入脚本参数、超时时长、执行账号,也可以勾选“敏感参数”,勾选后脚本参数框对输入的内容不直接显示。 图3 脚本参数 选择“目标实例”。 单击“添加资源”,弹出选择实例页面。 实例类型默认为“ECS”。选择方式默认采用“手动选择”方式,选择方式的详细说明请参见表2。 图4 添加实例 表2 选择方式说明
日志分析(旧版) 搜索日志 查看日志文件 配置虚机日志采集路径 添加日志转储 接入LTS 日志流
行操作列的“安装”或“卸载”。 进入文件包安装或文件包卸载页面,选择“执行账号”,指定执行任务的OS账号。 选择“目标实例”。 单击“添加资源”,弹出选择实例页面。 实例类型默认为“ECS”。选择方式默认采用“手动选择”方式,选择方式的详细说明请参见表2。 图2 添加实例 表2 选择方式说明