正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
务发生异常,迅速处理故障,避免因资源问题造成业务损失。 配置云服务器全部挂载点告警规则 配置云服务器全部挂载点磁盘使用率告警规则 云监控服务提供了配置云服务器全部挂载点告警规则的能力。磁盘使用率指标调整为挂载点维度,在新配置磁盘使用率告警规则时需要选择“云服务器挂载点”维度。
主体订阅:通过在消息通知服务(SMN)配置的主题,快速将该消息推送至消息主题。 通知配置模块如下图所示。 通知策略模块如下图所示。 监控最核心的职责是帮助用户发现问题,而问题的发现是依赖监控系统中对告警规则的配置,告警规则配置的覆盖率、准确率将直接影响监控系统的故障发现率。 父主题: 告警配置方式
选择探测点。 当前仅支持选择已安装Agent插件的Linux操作系统的主机资源,其中Agent需要升级到2.6.6版本。 - 请求方式 HTTP(S)标准的请求方法,包括GET、POST、HEAD,其中POST支持提交内容。 HEAD 高级配置 暂不配置 现在配置 现在配置 提交内容 可用性监控探测时POST的请求内容。
发布区域:以控制台实际上线区域为准 Agent支持的系统都有哪些? 安装Agent(Linux) 安装Agent(Windows) 站点监控 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。其提供简单的添加配置,不再浪费资源和精力配置复杂的开源产品。并且支持站点异常告警,不用担心网站出问题而无人知晓。
配置自定义看板 自定义看板作为云服务看板的补充,允许您可以通过自定义的方式创建可视化看板,您可以自主选择指标、图表类型来展现您关注的资源图表。 前提条件 请确保您拥有云监控服务的操作权限,并且可以创建自定义看板。 操作步骤 单击系统左侧主菜单“我的看板”,进入看板列表页面,单击“创建看板”创建您的看板。
插件名称,不传查所有插件,目前仅支持telescope 枚举值: telescope extension_status 否 String 插件状态,不传查所有状态, none未安装,running运行中,stopped已停止,fault故障(进程异常),unknown故障(连接异常) 枚举值: none running
正则匹配:^([0-9A-Za-z]){1}([0-9A-Za-z]|_|-)*$ invocation_type 否 String 任务类型, INSTALL安装, UPDATE升级, ROLLBACK回退,RETRY重试 枚举值: INSTALL UPDATE ROLLBACK RETRY invocation_target
"unknown" }] } 案例三 ECS实例未安装agent插件 在CES页面“主机监控”下的【弹性云服务器】中找到对应ECS的实例,在【插件状态】列点击,未安装,然后根据使用指南安装agent插件。 案例四 ECS实例安装的agent插件没有上报磁盘使用率指标数据 agen
告警配置方式 配置指标告警
在“云服务监控”页面,勾选需要“配置数据存储”的云服务资源,单击“批量配置数据存储”,进入“批量配置数据存储”页面。 或在“主机监控”页面,勾选需要“配置数据存储”弹性云服务器,单击“批量配置数据存储”,进入“批量配置数据存储”页面。 在“配置数据存储”或“批量配置数据存储”页面,按照表1配置参数: 表1
虚拟机上GPU健康状态。该指标是一个综合指标,0代表健康,1代表亚健康,2代表故障。 - 2.4.5 Linux: 通过调用GPU卡的libnvidia-ml.so.1库文件获取 Windows: 通过调用GPU卡的nvml.dll库文件获取 gpu_performance_state 该GPU的性能状态。 P0-P15、P32,
Dashboards”,鼠标滑过需要修改的监控看板,在待配置的“监控视图”区域右上角单击“配置”图标,弹出“配置监控视图”页面。 在该页面,用户可以对监控视图标题进行编辑,也可以增加监控指标、删除监控指标或修改当前已添加的监控指标。 图1 配置监控视图 目前单个“监控视图”最多支持添加50个监控指标。
自定义看板配置方式 配置自定义看板
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现在拆线图和条形图中完成监控指标的增加、修改、删除等日常操作。 曲线图的操作步骤
关键指标展示该类云服务资源的重点业务指标,并支持自定义编辑指标,可根据业务需要对关键指标进行配置推荐。 图4 云服务概览 图5 关键指标 配置云服务告警规则 各类云服务需要给哪些指标配置告警,可参考最佳监控实践推荐的指标及告警策略。最佳实践如:华为云监控配置最佳实践 v5.3.1.xlsx。 步骤: 登录管理控制台。
主机监控: 通过在弹性云服务或裸金属服务器中安装云监控服务Agent插件,用户可以实时采集ECS或BMS 1分钟级粒度的监控数据。已上线CPU、内存和磁盘等40余种监控指标。有关主机监控的更多信息,请参阅主机监控简介。 灵活配置告警规则: 对监控指标设置告警规则时,支持对多个
区域的Endpoint不同,您可以从地区和终端节点获取。 例如IAM服务在“华北-北京四”区域的Endpoint为“iam.cn-north-4.myhuaweicloud.com”。 resource-path 资源路径,即API访问路径。从具体API的URI模块获取,例如“获
获取企业项目ID 操作场景 在调用接口时,部分URL中需要填入企业项目ID,所以需要获取到项目ID。本章节介绍如何通过控制台获取企业项目ID。 从控制台获取企业项目ID 登录管理控制台。 单击页面右上方的“企业 > 项目管理”。 分辨率低的情况下单击页面右上方的“更多 > 企业 > 项目管理”。
主机id列表(INSTALL和UPDATE时必须) 数组长度:1 - 100 invocation_type 是 String 任务类型,INSTALL 安装,UPDATE升级,ROLLBACK回退,RETRY重试 枚举值: INSTALL UPDATE ROLLBACK RETRY invocation_target
遇到权限问题,需要配置涉及服务的细粒度授权特性,才可以正常使用,支持细粒度授权的云服务列表请参考: 使用IAM授权的云服务。 CES AgentAccess CES Agent正常运行所需的必要权限。 说明: 为了保证CES Agent能够正常提供服务,需要配置委托,详细操作请参见如何配置委托?