检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Agent状态切换或监控面板有断点该如何处理? 问题现象 当云监控服务的Agent进程出现以下现象时,可能是因为Agent负载过高,状态不稳定导致: 管理控制台主机监控页面的“插件状态”参数在“运行中”和“故障”两个状态切换。 监控指标面板中存在断点。 约束与限制 当前章节的修复
总览 总览由资源监控和站点监控两部分组成。通过查看总览,让用户实时了解各云服务的资源告警情况和站点响应情况。 资源监控 资源监控是以资源分组维度横向展示和各个服务资源维度纵向分布,将各个资源的实时告警情况进行展示,用户可按照不同维度对资源告警进行关注,方便高效管理您的资源。 下面将介绍资源监控如何查看和使用。
CES Agent如何通过授权获取临时AK/SK? 为了更加安全高效的使用云监控服务提供的主机监控功能,我们提供了最新方式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所
Agent状态切换或监控面板有断点该如何处理? 问题现象 当云监控服务的Agent进程出现以下现象时,可能是因为Agent负载过高,状态不稳定导致: 管理控制台主机监控页面的“插件状态”参数在“运行中”和“故障”两个状态切换。 监控指标面板中存在断点。 约束与限制 当前章节的修复
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现在拆线图和条形图中完成监控指标的增加、修改、删除等日常操作。 曲线图的操作步骤
手动配置Agent(Linux,可选) 用户成功安装Agent插件后,推荐您采用“修复插件配置”方式配置Agent。如果修复插件配置不成功或其他原因,你可以采用本章节提供的手工方式配置Agent。 前提条件 已成功安装Agent插件。 确认正在使用的Agent版本 使用root账号,登录ECS。
安装GPU指标集成插件 通过在GPU加速型Linux实例上安装GPU监控插件,可以为用户提供系统级、主动式、细颗粒度的GPU监控,包含GPU指标收集和GPU系统事件上报。GPU支持监控的指标,参见GPU指标。 本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版GPU监控插件:
快速入门 概述 本节通过调用一系列云监控的API为ECS的cpu_util指标创建告警规则,当指标的数值达到设置的阈值时及时通知用户处理。 通过IAM服务获取到的Token有效期为24小时,需要使用同一个Token鉴权时,可以先将Token缓存,避免频繁调用。 操作步骤 Token认证,具体操作请参考认证鉴权。
主机监控 如何配置DNS和安全组? 如何配置委托? CES Agent如何通过授权获取临时AK/SK? Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束
约束与限制 当前云监控服务对单个用户的使用限制如表1所示。调整配额请参考配额调整。 表1 用户资源限制 配额类型 默认限制 可创建告警规则数 1000 可创建自定义告警模板数 200 告警模板可添加告警规则数 50 可创建监控看板数 10 单监控看板可添加监控视图数 50 历史告警保存时间
管理Agent 本章节指导如何在Linux平台、Windows平台查看、启动、停止、更新和卸载Agent。 前提条件 已成功安装Agent插件。 Linux平台 查看、启动、停止、更新和卸载Agent需使用root用户。 查看Agent版本 使用root账号,登录主机。 执行如下命令,确认使用Agent的版本。
查看告警记录详情 告警记录展示所有告警规则的状态变化,默认展示近7天的告警记录,通过选择时间可以展示近30天的告警记录,用户可以统一、方便地回溯和查看告警记录。当出现告警时,可以参考本章节查看具体云资源的告警记录详情。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。
Agent安装配置方式说明 安装Agent方式有如下几种,你可以根据你所使用的服务的操作系统类型、是否有多个服务器以及个人习惯选择任何一种或多种安装方式: 安装场景 支持的服务 参考章节 控制台界面安装/升级Agent ECS 在控制台界面安装/升级Agent 安装Agent(Linux)
管理站点监控 操作场景 当业务变化或者当之前配置的站点监控规则不符合您的业务需求时,您可参考本章节修改、停用、启用或删除站点监控。 修改站点监控 登录管理控制台。 单击“服务列表 > 云监控服务 > 站点监控”。 单击监控站点所在行的“更多 > 修改站点监控”,或者则勾选多个监控站点,单击列表上方的“修改”。
创建自定义告警模板 功能介绍 创建自定义告警模板 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/alarm-templates
查询告警模板详情 功能介绍 查询告警模板详情 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/alarm-templates/{template_id}
修改自定义告警模板 功能介绍 修改自定义告警模板 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI PUT /v2/{project_id}/alarm-templates/{template_id}
通过HTTP(S)探测监控网络异常 应用场景 通过广域网质量功能监控不同地域不同网络环境用户访问某个域名时的连通性。当域名连通性为低于预期时,您可以通过报警信息分析异常原因,还可以根据探测结果排查问题。本文以中国境内各省份的三大运营商(中国移动、中国电信、中国联通)探测某个域名为
管理广域网质量监控 创建广域网质量监控任务后,当业务变化或者当之前配置的广域网质量监控规则不符合您的业务需求时,您可参考本章节修改、停用、启用或删除广域网质量监控。 前提条件 已创建广域网质量监控任务。 修改广域网质量监控任务 登录管理控制台。 单击“服务列表 > 云监控服务”。
查询告警模板关联的告警规则列表 功能介绍 查询告警模板关联的告警规则列表 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/a