检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
BMS与ECS的运行状态对整体业务至关重要,CPU、内存、磁盘使用率等会直接影响整体业务状态,因此,需使用主机监控和事件监控随时监控ECS与BMS的运行状况。 网站与各个基础接口的可用性、响应时间、丢包率等会直接影响用户使用的流畅程度,需使用站点监控随时监控各站点的运行情况。
主机监控 针对众包平台中使用的ECS和BMS,ECS作为业务的计算资源,数据库部署在BMS上。因此,BMS的磁盘速度会影响数据库操作速度,ECS的内存和CPU占用大小等会影响业务执行速度,为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。
请求参数: { "metrics": [{ "dimensions": [{ "name": "rds_cluster_sqlserver_id", "value": "5e319882ffa04c968e469035a116b2d1in04" }], "
查询主机监控维度指标信息 功能介绍 根据ECS/BMS资源ID查询磁盘、挂载点、进程、显卡、RAID控制器维度指标信息;维度NPU已经为原始值,不需要调用该接口进行额外查询获取指标信息 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。
表3 resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。
修改DNS与添加安全组(Linux) 操作场景 本章节指导用户为Linux系统的ECS或BMS添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,BMS操作步骤类似。
格式为service.item;service和item必须是字符串,必须以字母开头,只能包含0-9/a-z/A-Z/_,service.item总长度最短为3,最大为32,其中service不能为“SYS”、“AGT”和“SRE”,namespace不能为SERVICE.BMS,
表3 resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。
成功, error: 失败 枚举值: successful error error_msg String 错误信息 最小长度:0 最大长度:128 状态码: 400 表6 响应Body参数 参数 参数类型 描述 error_code String 请求异常内部业务状态码 最小长度
表2 查询检索参数说明 名称 是否必选 参数类型 说明 namespace 否 String 查询服务的命名空间,各服务命名空间请参考支持监控的服务列表。
表3 resources字段数据结构说明 名称 参数类型 说明 namespace String 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。
成功,CANCELED 取消,ROLLBACKED已回退 枚举值: PENDING RUNNING TIMEOUT FAILED SUCCEEDED CANCELED ROLLBACKED invocation_target String 任务对象,目前仅支持telescope
选择要安装Agent的ECS或BMS,安装Agent插件。 修改待安装Agent的ECS或BMS的DNS并添加安全组,具体步骤请参见修改DNS与添加安全组(Linux)或修改DNS与添加安全组(Windows)。
创建主机监控的告警通知 操作场景 本章节指导用户对ECS或BMS的监控指标创建告警规则。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入主机监控页面。
表示由裸金属服务器调用,ADMIN_SERVER表示由运维平台调用 枚举值: CES APICOM_BMS ADMIN_SERVER version 否 String 版本号 最小长度:0 最大长度:64 正则匹配:^([0-9A-Za-z]|_|-|\.)+$ 响应参数 状态码:
主机监控 通过监控ECS或BMS的CPU使用率、内存使用率、磁盘等基础指标,确保ECS或BMS的正常使用,避免因为对资源的过度使用造成业务无法正常运行。 处理异常场景 云监控服务会根据您创建的告警规则,在监控数据达到告警策略时发送告警信息,让您及时获取异常通知,查询异常原因。
namespace=SYS.CloudTable&metric_name=cmdProcessMem&dim.0=cluster_id,f2fbxxxc-36b2-4d1d-895d-972a4d656xxx&dim.1=instance_name,hmaster-active&from
描述 one_click_alarms Array of one_click_alarms objects 一键告警列表 数组长度:1 - 1000 表4 one_click_alarms 参数 参数类型 描述 one_click_alarm_id String 一键告警ID namespace
202 Accepted 请求已被接受。 204 No Content DELETE操作正常返回。 异常 返回值 说明 400 Bad Request 服务器未能处理请求。 401 Unauthorized 被请求的页面需要用户名和密码。
事件监控 在实际的业务的运行中,ECS、BMS可随时根据业务调整,进行删除、重启、关闭、删除网卡、删除安全组等操作。因此,可以使用事件监控随时监控ECS、BMS的运行状态。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。