检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看主机监控的监控指标 操作场景 本章节指导用户查看主机监控指标,监控指标分为Agent插件采集的细颗粒度的操作系统级别监控指标和ECS自带的监控指标。 操作系统监控指标和基础监控指标请参见云产品监控指标。 前提条件 已完成Agent插件的安装。安装请参考安装配置Agent进行安装。
图1所示。 图1 创建站点监控 配置完成后,单击“确定”,完成创建站点监控。 创建站点监控完成后,单击站点名称右侧的“ 创建告警规则”,为设置的站点配置告警规则。 在创建告警规则界面,按照界面提示配置参数,参数说明请参见配置参数。 建议针对可用性≤95%、响应时间≥400ms、丢
添加数据转储 操作场景 数据转储可以实时将云服务监控数据转储到分布式消息服务Kafka中。当您需要通过分布式消息服务Kafka的控制台或使用开源Kafka客户端查询云服务的监控指标时,可以使用云监控服务提供的数据转储功能。 一个账户最多创建20个数据转储任务。 添加“数据转储”功能按照客户白名单开放。
查询指标列表 功能介绍 查询系统当前可监控指标列表,可以指定指标命名空间、指标名称、维度、排序方式,起始记录和最大记录条数过滤查询结果。 云服务资源删除后,会保留3个小时的数据缓存,在3小时之内还能查到资源对应的监控指标,属于正常现象。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
查询主机配置数据 功能介绍 查询指定时间范围指定事件类型的主机配置数据,可以通过参数指定需要查询的数据维度。 该接口提供给HANA场景下SAP Monitor查询主机配置数据,其他场景下查不到主机配置数据。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
创建资源分组(V1) 功能介绍 创建资源分组。资源分组支持将各类资源按照业务集中进行分组管理,可以从分组角度查看监控与告警信息以提升运维效率。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
告警 告警简介 告警规则 告警记录 告警模板 告警通知 应用示例:用户自定义创建弹性云服务器CPU利用率告警 一键告警 告警屏蔽
事件监控最佳实践 弹性云服务器事件 关系型数据库事件 弹性公网IP事件 父主题: 场景化实践案例
Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 安装配置Agent成功,需要等待2分钟,管理控制台上才会有操作系统监控数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Ag
场景化实践案例 电商平台业务监控 云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 使用资源分组和告警功能上报指定资源的监控指标 配置云服务器全部挂载点磁盘使用率告警规则
查询Agent任务列表 功能介绍 查询Agent任务列表 接口约束 目前拉美-布宜诺斯艾利斯一、拉美-利马一2个局点不支持该接口 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
修订记录 发布日期 修改记录 2021-06-16 配置云服务器全部挂载点磁盘使用率告警规则上线。 2020-03-09 使用资源分组和告警功能最佳实践上线。 2019-03-06 事件监控最佳实践上线。 2019-01-22 云监控在众包平台中的应用上线。 2018-09-30
在“监控任务”页面,单击待修改的广域网质量监控所在行的“修改任务”。 进入“编辑任务”界面。 根据界面提示配置参数,参数如表1所示。 探测协议与归属企业项目不能修改,因不同站点类型高级配置信息不同,切换后可能会丢失数据。 单击“立即修改”,完成修改操作。 启用广域网质量监控任务
如生效时间为08:00-20:00,则该告警规则仅在08:00-20:00发送通知消息。 接收渠道 接收告警通知的渠道。 当接收对象选择主题订阅时,不涉及此参数设置。 通知内容模板 可选择默认或自定义。 若选择自定义,可选择指标模板、事件模板、站点监控模板、广域网质量监控模板,或单击“创建通知内容模板”创建新的通知内容模板。
查询单条告警规则信息 功能介绍 根据告警ID查询告警规则信息。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /V1.0/{project_id}/alarms/{alarm_id}
修改告警规则策略(全量修改) 功能介绍 修改告警规则策略(全量修改) 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI PUT /v2/{project_id}/ala
删除告警规则 功能介绍 删除一条告警规则。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI DELETE /V1.0/{project_id}/alarms/{alarm_id}
删除自定义告警模板 功能介绍 删除自定义告警模板。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI DELETE /V1.0/{project_id}/alarm-t
实例运行状态异常 由于灾难或者物理机故障导致单机或者主实例出现故障时会上报本事件,属于关键告警事件,有可能导致数据库服务不可用。 检查是否有设置自动备份策略,并且提交工单处理。 单实例转主备实例失败 即创建备机或者备机创建完成后在主备机之间配置同步有故障,一般是由于备节点所在数据中
Agent插件状态显示“故障”该如何处理? 操作系统监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 “故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。