检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
关机”,将已安装Agent的ECS实例关机,如图1所示。 图1 关机 单击该实例右侧的“更多 > 镜像/磁盘/备份 > 创建镜像”,如图2所示。 图2 创建镜像 将私有镜像名称设置为“Image_with_agent”,单击“立即创建”,如图3所示。 图3 立即创建 购买新的ECS时选择创建的私有镜像“Image_w
主机监控 如何配置DNS和安全组? 如何配置委托? CES Agent如何通过授权获取临时AK/SK? Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束
alarm_description 否 String 告警描述,长度0-256。 condition 否 Condition object 告警规则设置的告警策略。 详细参数说明请参见表3。 alarm_action_enabled 否 Boolean 是否启用该条告警触发的动作,默认为true。
安装GPU指标集成插件 操作场景 通过在GPU加速型Linux实例上安装GPU监控插件,可以为用户提供系统级、主动式、细颗粒度的GPU监控,包含GPU指标收集和GPU系统事件上报。GPU支持监控的指标,参见GPU指标。 本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版GPU监控插件:
在“站点监控”界面,单击右上角“创建站点监控”,进入“创建站点监控”界面。 在弹出的“创建站点监控”对话框中根据界面提示配置参数,如图1所示。 图1 创建站点监控 监控频率建议设置为1分钟,更多参数说明如配置参数所示。 配置完成后,单击“确定”,完成创建站点监控。 单击站点监控所在行右侧“操作”列下的“创建告警规则”。
添加数据转储 操作场景 数据转储可以实时将云服务监控数据转储到分布式消息服务Kafka中。当您需要通过分布式消息服务Kafka的控制台或使用开源Kafka客户端查询云服务的监控指标时,可以使用云监控服务提供的数据转储功能。 一个账户最多创建20个数据转储任务。 添加“数据转储”功能按照客户白名单开放。
图1所示。 图1 创建站点监控 配置完成后,单击“确定”,完成创建站点监控。 创建站点监控完成后,单击站点名称右侧的“ 创建告警规则”,为设置的站点配置告警规则。 在创建告警规则界面,按照界面提示配置参数,参数说明请参见配置参数。 建议针对可用性≤95%、响应时间≥400ms、丢
查看主机监控的监控指标 操作场景 本章节指导用户查看主机监控指标,监控指标分为Agent插件采集的细颗粒度的操作系统级别监控指标和ECS自带的监控指标。 操作系统监控指标和基础监控指标请参见云产品监控指标。 前提条件 已完成Agent插件的安装。安装请参考安装配置Agent进行安装。
查询指标列表 功能介绍 查询系统当前可监控指标列表,可以指定指标命名空间、指标名称、维度、排序方式,起始记录和最大记录条数过滤查询结果。 云服务资源删除后,会保留3个小时的数据缓存,在3小时之内还能查到资源对应的监控指标,属于正常现象。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
查询主机配置数据 功能介绍 查询指定时间范围指定事件类型的主机配置数据,可以通过参数指定需要查询的数据维度。 该接口提供给HANA场景下SAP Monitor查询主机配置数据,其他场景下查不到主机配置数据。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
创建资源分组(V1) 功能介绍 创建资源分组。资源分组支持将各类资源按照业务集中进行分组管理,可以从分组角度查看监控与告警信息以提升运维效率。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
MN新协议公测。 创建飞书机器人 本文以PC版飞书为例,为您介绍创建飞书机器人的操作方法。 在PC版飞书中打开发送告警通知的飞书群。 单击设置图标,添加机器人。 单击添加自定义机器人选项。 输入机器人名字,例如:云监控告警通知,完成添加。 单击复制,复制Webhook地址。 添加自定义关键词,确认无误后单击完成。
告警 告警简介 告警规则 告警记录 告警模板 告警通知 应用示例:用户自定义创建弹性云服务器CPU利用率告警 一键告警 告警屏蔽
事件监控最佳实践 弹性云服务器事件 关系型数据库事件 弹性公网IP事件 父主题: 场景化实践案例
Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 安装配置Agent成功,需要等待2分钟,管理控制台上才会有操作系统监控数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Ag
场景化实践案例 电商平台业务监控 云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 使用资源分组和告警功能上报指定资源的监控指标 配置云服务器全部挂载点磁盘使用率告警规则
上报事件 功能介绍 事件监控为您提供上报自定义事件的接口,方便您将业务产生的异常事件或重要变更事件采集上报到云监控服务。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI
查询Agent任务列表 功能介绍 查询Agent任务列表 接口约束 目前拉美-布宜诺斯艾利斯一、拉美-利马一2个局点不支持该接口 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
修订记录 发布日期 修改记录 2021-06-16 配置云服务器全部挂载点磁盘使用率告警规则上线。 2020-03-09 使用资源分组和告警功能最佳实践上线。 2019-03-06 事件监控最佳实践上线。 2019-01-22 云监控在众包平台中的应用上线。 2018-09-30
查询某一事件监控详情 功能介绍 根据事件监控名称,查询该事件发生的详细信息。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /V1.0/{project_i