检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
当安装硬件监控插件后,硬件故障风险会以事件的方式主动通知到用户,需要用户及时授权对风险硬件的维修或更换。 监控插件实现硬件的故障风险检查时,仅会采集一些必要的系统指标用作巡检,详情见硬件监控指标采集说明。 仅支持部分Linux操作系统,详情见:Agent支持的系统有哪些?。 支持的规格:所有规格的BMS。
告警状态有哪些? 目前云监控服务支持五种告警状态: 告警中、已解决、数据不足、已触发、已失效。 告警中:监控指标数值达到告警配置阈值,资源正在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致;
"instance_host_info", "timestamp": 1450231200000, "value": "xxx" }, { "type": "instance_host_info"
申请公测工单。 完成工单提交:等待系统回复,当出现华为云工程师系统角色提示您确认风险的回复后,输入“风险已知晓,继续开通”,等待系统回复,完成公测协议开通。 企业微信群消息,钉钉群消息,飞书群消息有发送条数限制和接收方系统故障情况,可能会导致消息发送失败。出现上述原因时,SMN不保证消息成功送达。
Agent状态切换或监控面板有断点该如何处理? 问题现象 当云监控服务的Agent进程出现以下现象时,可能是因为Agent负载过高,状态不稳定导致: 管理控制台主机监控页面的“插件状态”参数在“运行中”和“故障”两个状态切换。 监控指标面板中存在断点。 约束与限制 当前章节的修复
云监控服务支持的聚合方法有哪些? 云监控服务支持的聚合方法有以下五种: 平均值 聚合周期内指标数据的平均值。 最大值 聚合周期内指标数据的最大值。 最小值 聚合周期内指标数据的最小值。 求和值 聚合周期内指标数据的求和值。 方差 聚合周期内指标数据的方差。 聚合运算的过程是将一个
Agent各种状态说明及异常状态处理方法 插件有以下四种状态: 运行中:插件正常运行,监控数据上报正常。 未安装: Agent未安装,安装方法参考《云监控服务用户指南》中的“Agent安装说明”章节。 Agent已经安装,委托未配置,委托配置方法参考如何配置委托?。 Agent已
Agent支持的系统有哪些? 以下列表中系统版本,是经过验证确定可以支持的系统版本,对于其余版本的支持情况,正在验证中。 以下系统都基于华为云IMS服务提供的公共镜像或者公共镜像创建的系统,如果使用未经验证的外部系统,可能会出现依赖问题或引入其他不稳定因素,请谨慎使用。 操作系统
使用的DNS非华为云DNS,请通过执行dig+目标域名获取到agent.ces.myhuaweicloud.com在华为云内网DNS下解析到的IP后再添加对应的hosts。华为云提供的内网DNS地址请参见华为云提供的内网DNS地址是多少?。 父主题: 主机监控
图3 路由配置正常-Linux 路由正常:排查结束。 路由异常:请执行7。 当路由不存在时,执行如下命令,添加路由: route add -host 169.254.169.254 gw 192.168.0.1 上述命令斜体部分192.168.0.1为云服务器的网关,请根据实际情况修改配置。
请求鉴权信息等。 详细的公共请求消息头字段请参见表3。 表3 公共请求消息头 名称 描述 是否必选 示例 Host 请求的服务器信息,从服务API的URL中获取。值为hostname[:port]。端口缺省时使用默认的端口,https的默认端口为443。 否 使用AK/SK认证时该字段必选。
2023-06-15 第六十次正式发布: 新增告警屏蔽。 2023-06-08 第五十九次正式发布: 下线“安装BMS本地磁盘故障风险监控插件”章节和“安装BMS网卡故障风险监控插件”章节。 2023-05-30 第五十八次正式发布: 安装Agent(Linux)新增“华北-乌兰察布一”安装命令。
bin文件夹下的conf.json文件。 配置如下参数,参数说明请参见表1。 认证用的AccessKey和SecretKey明文存储有很大的安全风险, 建议对该区域下所有云服务器或裸金属服务器安装的Agent做委托授权,委托方法请参考如何配置委托? { "Instance
cope/bin/conf.json 修改文件中的参数,具体参数请参见表1。 认证用的AccessKey和SecretKey明文存储有很大的安全风险, 建议对该区域下所有云服务器或裸金属服务器安装的Agent做委托授权,委托方法请参考如何配置委托? { "Instance
确认应用集群业务是否受损。 实例开机失败。 宿主机存在宕机风险 hostMayCrash 重要 弹性云服务器所在的宿主机存在宕机风险,且由于一些原因,无法通过热迁移手段规避该风险。 确认应用集群业务是否受损。 实例有重启风险。 实例计划迁移已完成 instance_migrate_completed
确认应用集群业务是否受损。 实例开机失败。 宿主机存在宕机风险 hostMayCrash 重要 弹性云服务器所在的宿主机存在宕机风险,且由于一些原因,无法通过热迁移手段规避该风险。 确认应用集群业务是否受损。 实例有重启风险。 实例计划迁移已完成 instance_migrate_completed
该插件对于已对接云监控的云服务均支持指标数据的导出。为提高云服务资源的识别度、可读性,插件对于以下服务支持导出资源属性label,如ECS实例会增加hostname、ip等label,同时支持将华为云标签转化为label,满足对资源自定义label的诉求,具体如下表所示。 表1 拓展标签支持情况
云监控服务哪些资源支持企业项目? 目前,支持按企业项目分权分域的有:我的看板、资源分组、告警规则、可用性监控、云服务监控、站点监控和广域网质量监控。 父主题: 云服务监控
云监控服务支持哪些服务的企业项目维度的分权分域监控? 目前,云监控服务支持的企业项目维度的分权分域资源有:弹性云服务器、弹性伸缩、云硬盘、弹性IP、弹性负载均衡、云数据库、分布式缓存服务、文档数据库服务和分布式消息服务。 父主题: 云服务监控
Agent版本特性 CES Agent支持的镜像列表,参见 Agent支持的系统有哪些? CES Agent迭代版本已知版本特性如下: 2.7.2.1版本 基于2.7.2版本: 增加GPU指标。 增加NPU指标。 增加物理机硬件监控能力。详情说明参考BMS硬件监控插件说明。 2.7