检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击任务列表右上角的按钮,可刷新列表信息。 查看任务信息 单击任务ID,可以查看该任务的具体信息,包括主机名、IP名、插件类型、任务类型、执行状态、执行失败的原因、执行事件、执行耗时和查看操作日志。 过滤任务信息 在任务列表的表头,单击各列的,可按特定类型过滤显示任务的信息。 切换任务排序
实例的指标,以及新增指标和废弃指标。 当前仅CCE类型、ECS类型、云服务类型、通用实例、APM类型与default类型Prometheus实例支持。 仪表盘 AOM支持在Prometheus实例的“仪表盘”中通过系统预置的仪表盘模板快速监控云服务类型和default类型Prom
警源信息的告警。 XX+正则+表达式:表示根据正则表达式匹配告警的XX参数的值。例如设置为:资源类型+正则+host*,表示筛选出metedata字段中资源类型的值包含host字样的告警。 设置规则说明: 静默条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件。
安装ICAgent ICAgent用于采集指标、日志和应用性能数据。对于在ECS、BMS控制台直接购买的主机,您需手动安装ICAgent。对于通过CCE间接购买的主机,ICAgent会自动安装。 AOM和LTS使用的ICAgent功能完全相同,ICAgent采集的指标数据均上报到
设置信息的刷新频率。单击,根据需要从下拉列表中选择,例如,手动刷新、1分钟等。 查看该Prometheus实例上报的基础指标和自定义指标数量。 自定义指标上报量:自定义指标的24H上报量和所选时间范围内累计上报量。 基础指标上报量:基础指标的24H上报量和所选时间范围内累计上报量。 自定义
高危命令说明 高危命令指影响系统或服务的正常运行,或造成系统特殊文件被恶意删除或修改命令。自动化运维服务涉及的高危命令请参见表1。 表1 高危命令说明 高危命令名称 高危命令校验规则 样例 导致风险 vi /etc/xxx.xx command \\s*(vi|vim)\\s+/
关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角下钻分析指标、日志、告警数据,直击异常。 精准告警 构建指标告警、事件告警、日志告警的统一告警体系,提供分组、抑制和静默等告警降噪策略,结合告警通知和订阅等功能,帮助用户从容应对海量告警风暴,快速检测和修复业务告警。
件上报到AOM的指标进行监控,结合AOM应用运维管理平台和开源Grafana可以提供一站式全方位的监控体系,帮助业务快速发现和定位问题,减轻故障给业务带来的影响。AOM支持监控的具体指标请参见“开源社区Exporter列表”。 为了快速了解并进行中间件的指标接入AOM服务,建议您按照如下步骤进行操作:
实例类型默认为“ECS”。选择方式默认采用“手动选择”方式,选择方式的详细说明请参见表2。 图2 选择实例 表2 选择方式说明 选择方式 说明 手动选择 输入搜索条件,在实例列表中通过搜索条件来选取实例,默认按照名称搜索。 过滤条件 输入过滤属性和对应的过滤值,指定过滤条件来选择实例。 支持设置多个过滤条
输入DMS用户名和密码。如果DMS实例的接入方式配置的是“密文接入”,需要输入DMS实例的用户名和密码;否则不展示输入DMS用户名和密码配置项。 单击“验证并保存DMS配置信息”。 选择数据发送topic后,单击“确定”。 订阅内容选择“Webhook”。 请参考表2配置参数,设置相关参数后,单击“确定”。
搜索日志 当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。 在左侧导航栏中选择“日志 > 日志搜索”。 在“日志搜索”页面中选择日志页签(即组件、系统、主机)并按照界面提示设置日志查询条件。
可能原因一:ICAgent问题 修复建议:在左侧导航栏中选择“配置管理 > Agent管理”,在列表的“ICAgent状态”列查看ICAgent状态,若状态不为“运行”,则说明ICAgent未安装或运行异常,可参考表1进行处理。 表1 ICAgent修复建议 状态 修复建议 未安装 主机未安装ICAgen
AOM支持按企业项目以及资源细粒度对资源进行分类管理,帮助用户快速管理和使用资源。 资源分组最多可以创建100个。 创建资源分组 在左侧导航栏中选择“资源分组”,可查看资源分组的信息。 单击右上角的“创建资源分组”。 根据界面提示配置参数,具体如表1所示。 表1 配置参数 参数 说明 示例 分组名称 输入分组名称。
查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用率metric_name可以在主机指标中查看,集群ID和节点ID各自对应的name可以在
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
在规则列表中查看已创建的所有告警规则,并可根据需要执行以下操作,具体请参见表1。 图1 查看告警规则 表1 告警规则相关操作 操作 说明 过滤显示告警规则 在规则列表的列表项支持按规则名称、类型、状态等设置筛选条件,实现告警规则过滤显示。 刷新告警规则 在规则列表右上角单击,可实时获取所有告警规则的最新信息。
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
单个环境管理的同类实例资源数量最多不超过2000。 资源监控使用限制 表2 资源监控使用限制 分类 限制项 说明 仪表盘 仪表盘数量 1个区域中最多可创建1000个仪表盘。 仪表盘中的图表数量 1个仪表盘中最多可添加50个图表。 仪表盘中图表可选资源、阈值规则、组件或主机数量 1个数字图最多可添
功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重复繁杂的应用变更操作中解脱出来,提升运维操作的质量和效率,帮助企业运维转型和运维价值提升。 约束与限制 如需使用“自动
您需先为您的虚机安装ICAgent。ICAgent安装成功后,大概需要5分钟,您即可在“日志分析 > 日志路径”的主机列表中查看到您的虚机。 约束与限制 ICAgent只采集*.log、*.trace和*.out类型的日志文件,请确保日志文件后缀为.log、.trace或.out。例如,/opt/yi