检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控 通过监控ECS或BMS的CPU使用率、内存使用率、磁盘等基础指标,确保ECS或BMS的正常使用,避免因为对资源的过度使用造成业务无法正常运行。 处理异常场景 云监控服务会根据您创建的告警规则,在监控数据达到告警策略时发送告警信息,让您及时获取异常通知,查询异常原因。
搜索已添加的自定义策略名或CES AgencyCheck Access,选中策略,然后单击“下一步“。 选择“全局服务资源“,然后单击“确定“。 显示“授权成功“,单击“完成“。 父主题: 权限管理
表示由裸金属服务器调用,ADMIN_SERVER表示由运维平台调用 枚举值: CES APICOM_BMS ADMIN_SERVER version 否 String 版本号 最小长度:0 最大长度:64 正则匹配:^([0-9A-Za-z]|_|-|\.)+$ 响应参数 状态码:
Agent安装需要有以下权限: 全局:Security Administrator Region:ECS CommonOperations或BMS CommonOperations以及CES Administrator或CES FullAccess权限 图2 Agent安装所需用户权限
Agent安装需要有以下权限: 全局:Security Administrator Region:ECS CommonOperations或BMS CommonOperations以及CES Administrator或CES FullAccess权限 图2 Agent安装所需用户权限
正则匹配:^((([a-z]|[A-Z]|[0-9]){1}([a-z]|[A-Z]|[0-9]|_|-|\.)*)|\*){1,256}$ 响应参数 状态码: 200 表6 响应Body参数 参数 参数类型 描述 succeed_count Integer 成功添加的资源数目 最小值
正则匹配:^((([a-z]|[A-Z]|[0-9]){1}([a-z]|[A-Z]|[0-9]|_|-|\.)*)|\*){1,256}$ 响应参数 状态码: 200 表6 响应Body参数 参数 参数类型 描述 succeed_count Integer 成功删除的资源数目 最小值
probe_point_success_count 可用探测点数量 该指标用于统计正常状态探测点的个数。 probe_point_success_rate 可用探测点百分比 该指标用于统计可用探测点的百分比。
BMS不支持基础监控,需要安装主机监控Agent插件。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。数据采集频率为1分钟1次。除了CPU使用率等指标外,还可以支持内存使用率(Linux)等指标,详见云产品监控指标。
格式为service.item;service和item必须是字符串,必须以字母开头,只能包含0-9/a-z/A-Z/_,service.item总长度最短为3,最大为32,其中service不能为“SYS”、“AGT”和“SRE”,namespace不能为SERVICE.BMS,
为什么云服务器看不到内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标? 当前创建的Linux云服务器,均不支持内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标。但Windows云服务器是支持这四个指标的。 不同操作系统支持的基础监控指标情况请参考弹性云服务器监控指标支持列表
成功,CANCELED 取消,ROLLBACKED已回退 枚举值: PENDING RUNNING TIMEOUT FAILED SUCCEEDED CANCELED ROLLBACKED invocation_target String 任务对象,目前仅支持telescope
CES Agent会默认屏蔽docker相关的挂载点。
single multiple properties 否 properties object 视图展示配置 location 否 location object 监控视图图表坐标 unit 否 String 单位 表5 WidgetMetric 参数 是否必选 参数类型 描述 namespace
Agent不同插件状态说明及处理方式 Agent有以下五种状态: 未安装/未启动:指未在该ECS/BMS中安装Agent或手动停止了Agent。 运行中:Agent运行正常,可正常上报监控数据。
表2 裸金属服务器 事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 BMS SYS.BMS GPU SRAM存在 Uncorrectable ECC告警 SRAMUncorrectableEccError 重要 GPU卡SRAM出现Uncorrectable
表2 裸金属服务器 事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 BMS SYS.BMS GPU SRAM存在 Uncorrectable ECC告警 SRAMUncorrectableEccError 重要 GPU卡SRAM出现Uncorrectable
主机监控Agent对主机的性能会有影响吗? 主机监控Agent占用的系统资源很小,性能基本不会受到影响。 在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装
修改DNS与添加安全组(Linux) 本章节指导用户为Linux系统的ECS或BMS添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,BMS操作步骤类似。
Agent插件资源占用和熔断说明 资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保障用户的资源