检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。 可选:执行以下命令,切换至Agent安装路径的bin下。 Windows系统下,路径为:“C:\Program
主机监控 如何配置DNS和安全组? 如何配置委托? CES Agent如何通过授权获取临时AK/SK? Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束
Agent插件状态显示“运行中”但没有数据该如何处理? Agent一键修复后无监控数据问题排查(老版本Agent) 如何获取Agent的Debug日志? Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 监控数据中会出现跳点的情况 入网带宽和出网带宽出现负值 父主题: 故障排查
主体订阅:通过在消息通知服务(SMN)配置的主题,快速将该消息推送至消息主题。 通知配置模块如下图所示。 通知策略模块如下图所示。 监控最核心的职责是帮助用户发现问题,而问题的发现是依赖监控系统中对告警规则的配置,告警规则配置的覆盖率、准确率将直接影响监控系统的故障发现率。 父主题: 告警配置方式
发布区域:以控制台实际上线区域为准 Agent支持的系统都有哪些? 安装Agent(Linux) 安装Agent(Windows) 站点监控 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。其提供简单的添加配置,不再浪费资源和精力配置复杂的开源产品。并且支持站点异常告警,不用担心网站出问题而无人知晓。
配置自定义看板 自定义看板作为云服务看板的补充,允许您可以通过自定义的方式创建可视化看板,您可以自主选择指标、图表类型来展现您关注的资源图表。 前提条件 请确保您拥有云监控服务的操作权限,并且可以创建自定义看板。 操作步骤 单击系统左侧主菜单“我的看板”,进入看板列表页面,单击“创建看板”创建您的看板。
插件名称,不传查所有插件,目前仅支持telescope 枚举值: telescope extension_status 否 String 插件状态,不传查所有状态, none未安装,running运行中,stopped已停止,fault故障(进程异常),unknown故障(连接异常) 枚举值: none running
"unknown" }] } 案例三 ECS实例未安装agent插件 在CES页面“主机监控”下的【弹性云服务器】中找到对应ECS的实例,在【插件状态】列点击,未安装,然后根据使用指南安装agent插件。 案例四 ECS实例安装的agent插件没有上报磁盘使用率指标数据 agen
正则匹配:^([0-9A-Za-z]){1}([0-9A-Za-z]|_|-)*$ invocation_type 否 String 任务类型, INSTALL安装, UPDATE升级, ROLLBACK回退,RETRY重试 枚举值: INSTALL UPDATE ROLLBACK RETRY invocation_target
虚拟机上GPU健康状态。该指标是一个综合指标,0代表健康,1代表亚健康,2代表故障。 - 2.4.5 Linux: 通过调用GPU卡的libnvidia-ml.so.1库文件获取 Windows: 通过调用GPU卡的nvml.dll库文件获取 gpu_performance_state 该GPU的性能状态。 P0-P15、P32,
告警配置方式 配置指标告警
“批量配置数据存储”页面。 或在“主机监控”页面,勾选需要“配置数据存储”弹性云服务器,单击“批量配置数据存储”,进入“批量配置数据存储”页面。 在“配置数据存储”或“批量配置数据存储”页面,按照表1配置参数: 表1 配置数据存储参数 参数 说明 样例 OBS转储 是否配置OBS转储,可选择“转储”和“不转储”。
自定义看板配置方式 配置自定义看板
关键指标展示该类云服务资源的重点业务指标,并支持自定义编辑指标,可根据业务需要对关键指标进行配置推荐。 图4 云服务概览 图5 关键指标 配置云服务告警规则 各类云服务需要给哪些指标配置告警,可参考最佳监控实践推荐的指标及告警策略。最佳实践如:华为云监控配置最佳实践 v5.3.1.xlsx。 步骤: 登录管理控制台。
主机监控: 通过在弹性云服务或裸金属服务器中安装云监控服务Agent插件,用户可以实时采集ECS或BMS 1分钟级粒度的监控数据。已上线CPU、内存和磁盘等40余种监控指标。有关主机监控的更多信息,请参阅主机监控简介。 灵活配置告警规则: 对监控指标设置告警规则时,支持对多个
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现在拆线图和条形图中完成监控指标的增加、修改、删除等日常操作。 曲线图的操作步骤
Dashboards”,鼠标滑过需要修改的监控看板,在待配置的“监控视图”区域右上角单击“配置”图标,弹出“配置监控视图”页面。 在该页面,用户可以对监控视图标题进行编辑,也可以增加监控指标、删除监控指标或修改当前已添加的监控指标。 图1 配置监控视图 目前单个“监控视图”最多支持添加50个监控指标。
区域的Endpoint不同,您可以从地区和终端节点获取。 例如IAM服务在“华北-北京四”区域的Endpoint为“iam.cn-north-4.myhuaweicloud.com”。 resource-path 资源路径,即API访问路径。从具体API的URI模块获取,例如“获
String 企业项目ID,默认值为all_granted_eps。表示所有企业项目。 当查询所有企业项目时,配置为:all_granted_eps。 当需要查询某个企业项目时,配置为对应的企业项目ID,请参考获取企业项目ID。 样例 请求样例一:查询当前告警规则列表。 GET htt
获取企业项目ID 操作场景 在调用接口时,部分URL中需要填入企业项目ID,所以需要获取到项目ID。本章节介绍如何通过控制台获取企业项目ID。 从控制台获取企业项目ID 登录管理控制台。 单击页面右上方的“企业 > 项目管理”。 分辨率低的情况下单击页面右上方的“更多 > 企业 > 项目管理”。