检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维
仪表盘监控 AOM仪表盘监控概述 创建AOM仪表盘 创建AOM仪表盘(新版) 设置AOM仪表盘全屏模式在线时长 设置AOM仪表盘过滤器 统计图表说明 统计图表说明(新版)
服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 约束与限制 当前配置指标存储时长功能受限白名单开放,如有需求可以通过提交工单,为您开放此功能。 配置指标存储时长 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”。
查询时间序列 功能介绍 该接口用于查询系统当前可监控的时间序列列表,可以指定时间序列命名空间、名称、维度、所属资源的编号(格式为:resType_resId),分页查询的起始位置和返回的最大记录条数。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/series
查询时序数据 功能介绍 该接口用于查询指定时间范围内的监控时序数据,可以通过参数指定需要查询的数据维度,数据周期等。(该接口已不再演进,建议使用 (推荐)POST方法查询区间数据接口。) 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/samples
AOM告警规则概述 AOM提供告警规则和事件规则设置功能。通过创建指标、日志和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 功能说明 指标告警规则
APM指标数据未采集上来,可能有哪些原因? 如果APM探针刚接入,可以稍微等待几分钟后,就能看到数据。 如果显示数据采集被停止,可能的原因有: 实例级别停止,APM探针管理中采集被停止。 监控项级别停止,监控项状态列表某些监控项采集被人为停止。 APM控制台的“全局配置(系统管理 > 通用配置)”中字节码方式采集被停止。
将表格数据按照指定格式进行显示。 单位 自定义配置表格数据的单位。 小数位数 开启后显示数字小数点后的位数。 小数点位数 设置显示数值小数点位数。 查询分析设置 隐藏字段 选择目标字段,将该字段在表格中隐藏。 表格配置 每页显示 每页显示的数据条数。 显示总数 显示表格数据的总条目数。
量已达到150个,请删除不需要的告警模板后重新创建。 背景信息 AOM针对所有主机和所有服务的关键指标(包括CPU使用率指标、物理内存使用率指标、主机状态指标、服务状态指标)预置多种默认告警模板,显示在“告警模板”界面的“默认告警模板”页签下,供您选择使用。在默认告警模板所在行,
指标 需要监控的指标。单击“指标”文本框,通过下列框右侧的资源树,可以按资源类型快速选择需监控的指标。 aom_container_cpu_usage 统计周期 指标数据按照所设置的统计周期进行聚合。 1分钟 条件 指标监控的维度。不设置则表示选中全部资源。此处根据3中监控的工作负载设置条件。
提示框配置,当Y轴数据选择多个时,可对其进行排序显示。 X轴 显示X轴 开启后,显示X轴数据。 X轴名称 设置X轴名称。 Y轴 显示Y轴 开启后,显示Y轴数据。 Y轴名称 设置Y轴名称。 Y轴位置 设置Y轴位置,左边或者右边。 数字图:用于突出显示单个数值。当需要实时监控某个指标的最新数值时,可使用此类型的图表。
配置AOM告警降噪 AOM告警降噪概述 创建AOM告警分组规则 创建AOM告警抑制规则 创建AOM告警静默规则 父主题: 告警监控
告警规则创建完成后,可在“规则列表”中查看告警规则的规则名称、类型、状态、监控对象等信息,并可根据需要修改、启动或停止告警规则。 管理指标或事件告警规则 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警规则”,默认显示“指标或事件”页签。 在规则列表中查看已创建的所有告警规则,
方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。 单击响应耗时指标中的“蓝色”或错误分布中的“红色”数据条,跳转到当前组件的详细监控项页签。各组件监控项详情参见组件列表。 如果需要接入其他应用,可单击右上角“接入应用”跳转至接入中心,接入应用层组件,详情参见接入应用。 如果需要购
AOM告警规则概述 创建AOM指标告警规则 创建AOM事件告警规则 创建AOM应用性能监控告警规则 创建AOM日志告警规则 批量创建AOM云服务告警规则 管理AOM告警规则 标签和标注 普罗语句说明 父主题: 告警监控
>= dimensions 是 Array of Dimension objects 时间序列维度列表。可通过调用查询时间序列接口,查询当前监控的时间序列名称的时间序列维度列表。 evaluation_periods 是 Integer 间隔周期。 is_turn_on 否 Boolean
名称设置为“主机名称”,维度值设置为“192.168.16.4”,表示只监控主机名为“192.168.16.4”的资源。 匹配方式为“!=”:此时维度值可从下拉列表中直接选择。例如,维度名称设置为“主机名称”,维度值设置为“192.168.16.4”,表示监控除主机名为“192.168
503 ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码 请参见错误码。 父主题: 监控
>= dimensions 是 Array of Dimension objects 时间序列维度列表。可通过调用查询时间序列接口中,查询当前监控的时间序列名称的时间序列维度列表。 evaluation_periods 是 Integer 间隔周期。 最小值:1 最大值:5 is_turn_on
Unauthorized 在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 错误码 请参见错误码。 父主题: 监控