检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云监控服务”。 单击“任务中心”,进入“任务中心”页面。 在“任务中心”页面的“Agent维护”页签可以查看安装、配置与升级Agent的任务信息。 对于Agent升级的任务,若“任务状态”为“成功”,可通过操作列的“回退”将当前的任务插件将回退到原版本;若“任务状态”为“超时”,可通过操作列的“重试”重新执行该任务。
本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版GPU监控插件: 操作步骤(单节点安装) 操作步骤(多节点批量安装) 约束与限制 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些?。 支持的GPU加速型规格:
资源分组 一套完整的电商平台会使用到ECS、CDN、AS、安全服务、RDS、OBS、VPC等服务,您可以创建资源分组,将电商业务的ECS、EIP、EVS等资源划分成一个分组,通过资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规则,可以极大的降低运维复杂度,提高运维效率。
TTPS告知用户。 增值服务的计费方式如下: 对象存储服务(OBS) 对象存储服务提供按需付费、包年包月两种计费方式。用户可以根据实际需求变更资源的资费方式。OBS开通时,默认按照按需付费(使用量按小时计费),同时也支持包年包月(资源包)的方式提前购买使用额度和时长。 由于云监控
理的在线关系型数据库服务。在使用关系型数据库中,需持续关注数据库状态,可通过事件监控,对异常事件告警进行处理,保证业务稳定运行。 表1 RDS重点事件 事件名称 事件说明 处理步骤 创建实例业务失败 创建实例失败产生的事件,一般是磁盘个数,配额大小都很小,底层资源耗尽导致。 检查
Integer 分页查询时查询的起始位置,表示从第几条数据开始,默认为0 最小值:0 最大值:10000 limit 否 Integer 查询结果条数的限制值,取值范围为[1,100],默认值为100 最小值:1 最大值:100 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述
Integer 否 分页起始值,类型为integer,默认值为0。 limit Integer 否 单次查询的条数限制,取值范围(0,100],默认值为100,用于限制结果数据条数。 样例 GET https://{云监控的endpoint}/V1.0/{project_id}/event/{event_name}
告警对象 告警触发方式 一键告警 当重要事件发生时,立即触发告警通知。 优势:配置简单,一键式打开开关。 弹性云服务器、弹性公网IP和关系型数据库的重要事件。 事件监控 指标监控 立即触发 普通告警 根据设置的告警策略触发告警。例如:CPU利用率在5分钟内的平均值连续5次>=80%时发送告警通知。
请求示例 批量增加告警规则资源 { "resources" : [ [ { "name" : "rds_cluster_id", "value" : "rds000000000001" } ] ] } 响应示例 无 状态码 状态码 描述 200 增加资源成功 400
}([0-9A-Za-z]|_|-)*$ invocation_type 否 String 任务类型, INSTALL安装, UPDATE升级, ROLLBACK回退,RETRY重试 枚举值: INSTALL UPDATE ROLLBACK RETRY invocation_target
请求示例 批量删除告警规则资源 { "resources" : [ [ { "name" : "rds_cluster_id", "value" : "rds000000000001" } ] ] } 响应示例 无 状态码 状态码 描述 200 删除资源成功 400
period 是 Integer 指标周期,单位是秒; 0是默认值,例如事件类告警该字段就用0即可; 1代表指标的原始周期,比如RDS监控指标原始周期是60s,表示该RDS指标按60s周期为一个数据点参与告警计算;如想了解各个云服务的指标原始周期可以参考“支持服务列表”,300代表指标按5分钟聚合周期为一个数据点参与告警计算。
单台主机下安装Agent 操作场景 本章节主要介绍如何在单台主机中手动安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 目前只支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。
Integer 分页查询时查询的起始位置,表示从第几条数据开始,默认为0 最小值:0 最大值:10000 limit 否 Integer 查询结果条数的限制值,取值范围为[1,100],默认值为100 最小值:1 最大值:100 namespace 否 String 查询服务的命名空间,各服务命名空间请参考“服务命名空间”
安装Agent(Windows) 操作场景 本章节主要介绍如何在主机中安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 目前只支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。
批量安装Agent 操作场景 本章节主要介绍如何批量安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 批量安装不支持跨区域执行。 批量安装的主机需同属一个VPC。 Windows版本暂不支持批量安装Agent。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。
6913-4f3b-bd0a-3f96711e004d limit 否 Integer 取值范围(0,1000],默认值为1000。 用于限制结果数据条数。 order 否 String 用于标识结果排序方法,按时间戳排序。 取值说明,默认为desc: asc,升序 desc,降序
天的时间戳。 start 否 分页起始值,类型为integer,默认值为0。 limit 否 单次查询数据的条数限制。取值范围(0,100],默认值为100,用于限制结果数据条数。 样例 GET https://{云监控的endpoint}/V1.0/{project_id}/alarm-histories
period Integer 指标周期,单位是秒; 0是默认值,例如事件类告警该字段就用0即可; 1代表指标的原始周期,比如RDS监控指标原始周期是60s,表示该RDS指标按60s周期为一个数据点参与告警计算;如想了解各个云服务的指标原始周期可以参考“支持服务列表”,300代表指标按5分钟聚合周期为一个数据点参与告警计算。
置”方式配置Agent。如果“修复插件配置”不成功或其他原因导致无法配置Agent,你可以采用本章节提供的手工方式配置Agent。 约束与限制 目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已成功安装Agent插件。