检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
请求示例 { "max_instances": 100,//最大实例数,表示扩容最大限制 "min_instances": 1,//最小实例数,表示扩容最小限制 "cooldown_time": 60 //冷却时间,应用的策略执行完后必须冷却该时间后才能继续执行下条策略
建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维
_request_megabytes) 该指标用于统计测量对象限制的物理内存总量。 ≥0 兆字节(MB) 物理内存使用率(aom_container_memory_usage) 该指标用于统计测量对象已使用内存占限制物理内存总量的百分比。 0~100 百分比(%) 物理内存使用量
通过告警降噪清除告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 实践场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多,需要从众多告警中快速及时发现故障,全面掌握应用。
AOM 最佳实践一览表 最佳实践 说明 建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 通过告警降噪清除告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
Prometheus监控 如何将Prometheus数据接入到AOM? Prometheus监控功能采集的指标数据,如何区分基础指标和自定义指标? 不能废弃以aom_prom_fixed作为前缀的指标
常见计费问题 如何查看每天的自定指标上报量? AOM控制台的“资源消耗”界面会展示每天指标上报量展示,具体操作请参见统计资源消耗。 如何查看有哪些Prometheus指标? 目前仅default类型、CCE类型、云服务类型的Prometheus实例支持指标查看功能。 登录AOM 2
当在使用AOM的仪表盘全屏模式进行监控时,全屏模式会随着用户账号的退出而退出,无法实时进行监控。为满足您的多样化需求,AOM支持您自定义全屏模式在线时长。 约束与限制 为提高安全性,请在不需要使用全屏模式进行监控时,及时退出全屏模式。 全屏模式在线时长与是否操作无关,只要超过已设时长,则退出到登录界面。
击“切换版本”进行切换操作。您需要注意的是,AOM每24小时仅支持一次从按需版退回到基础版本的操作,退回基础版本后资源使用超出基础版本配额限制的,将进行数据清理,请确认并了解风险。 登录AOM控制台,进入“总览>监控概览”,单击顶部“切换版本”。 选择版本,勾选提示信息,单击“立即切换”。
kubernetes.AOM.log.relabel: '{"key1":"value1", "key2":"value2"} 自定义标签限制如下: 最多可设置16组“key:value”字段。 key或value的参数值最多不超过64个字符。 自定义标签不区分大小写,且不能与默
告警管理 如何区分告警和事件?
单击页面右侧的“保存”。 “仪表盘”界面右上角的自动刷新开关对仪表盘中所有的图表生效。 开启(默认) 仪表盘中的数据每分钟自动刷新一次。 关闭 仪表盘中的数据不会自动刷新。 更多仪表盘操作 仪表盘创建完成后,您还可以执行表1中的操作。 表1 相关操作 操作对象 操作 说明 仪表盘
None 操作指导 应用运维管理 AOM 如何创建告警规则 04:10 创建告警规则
其他常见问题 AOM 1.0与AOM 2.0使用对比 AOM与APM有何区别? AOM的日志服务与LTS的日志服务有何区别? 如何创建委托apm_admin_trust?
”。 单击“复制命令”复制安装命令。 使用PuTTY等远程登录工具,以root用户登录待安装ICAgent的服务器,执行以下命令,在安装前关闭历史记录。 set +o history 执行复制到的命令,根据提示输入已获取的AK和SK。 安装完成后,执行以下命令,开启历史记录。 set
自动化、无差异化运维,将运维工作从日常重复繁杂的应用变更操作中解脱出来,提升运维操作的质量和效率,帮助企业运维转型和运维价值提升。 约束与限制 如需使用“自动化运维”功能,需提前在“菜单开关”中开启自动化运维的开关,详细操作请参见菜单开关。 功能说明 表1 自动化运维功能说明 类别
数据订阅 AOM支持用户订阅指标或者告警信息,订阅后可以将数据转发到用户配置的kafka或DMS的Topic中,供消费者消费转发的订阅的信息。 数据订阅功能当前受限开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 最多可创建10个数据订阅规则。 创建订阅规则 在左侧导航栏中选择“配置管理
当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
“作业管理”页面展现所有作业信息,您可在这里新建作业,也可以创建执行方案、删除执行方案,并将作业的执行方案发布成服务。发布的服务可以在服务场景查看。 约束与限制 作业管理最多可以创建1000个作业。 每个作业最多支持创建20个全局参数、20个作业步骤、50个执行方案。 创建作业 登录AOM 2.0控制台。
异常。 基于应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,全局分析问题。 调用链下钻分析、细粒度根因定位。 约束与限制 智能洞察基于APM平台采集的应用数据进行分析,因此必须已开通应用性能管理APM服务,并将应用接入APM平台才可以为应用开通智能洞察功能。