检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
告警通知是什么,分为几类? 告警通知是告警状态触发时所采取的行为,用户可以在创建、修改告警的时候设置通知,也可以关闭通知。 通知目前支持两种: 触发告警时给用户发送邮件或短信通知或通过HTTP、HTTPS形式发送消息至服务器。 触发弹性伸缩自动扩容和缩容。 父主题: 告警
State Transfer)风格API,支持您通过HTTPS请求调用,调用方法请参见如何调用API。 同时云监控服务还提供多种编程语言的SDK供您使用,SDK的使用方法请参见https://console.huaweicloud.com/apiexplorer/#/sdkcenter/CES
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应
原始采样数据实时上报,提供对云服务的实时监控,实时触发产生告警并通知用户。 监控可视化 云监控服务通过监控面板为用户提供丰富的图表展现形式,支持数据自动刷新以及指标对比查看,满足用户多场景下的监控数据可视化需求。 多种通知方式 通过在告警规则中开启消息通知,当云服务的状态变化触发告警规则设置的阈值时,系
历史告警保存时间 7天 单次创建告警规则可选择的被监控对象数 5000 单次可创建告警规则条数 1000 说明: 若选择监控对象为50个,监控指标为20个,则可创建的告警规则条数为1000。 发送通知可选择主题数 5 单次导出监控数据条数 400 说明: 若监控对象为400个,则监控指
批量删除告警规则资源 功能介绍 批量删除告警规则资源(资源分组类型的告警规则不支持),资源分组类型的修改请使用资源分组管理相关接口 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
查询云监控支持的API所有版本号。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET / 请求消息 请求样例 GET https://{云监控的终端节点}/ 响应消息
批量增加告警规则资源 功能介绍 批量增加告警规则资源(资源分组类型的告警规则不支持),资源分组类型的修改请使用资源分组管理相关接口 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
监控维度,例如弹性云服务器的维度为instance_id。各服务监控指标对应的维度请参考支持监控的服务列表中对应服务的监控指标说明。 指标的维度,目前最大支持3个维度,维度编号从0开始;维度格式为dim.{i}=key,value。key的最大长度32,value的最大长度为256。 例如dim
将实时监控数据接入自建Prometheus 部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件
指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 字符格式必须以字母开头,只能包含0-9/a-z/A-Z/_-,字符长度最短为1,最大为96。 dim 否 String 监控维度,例如弹性云服务器的维度为in
事件内容,最大长度4096。 group_id 否 String 所属分组。 资源分组对应的ID,必须是已存在的分组ID。 分组ID查询方法: 登录管理控制台。 单击“云监控服务”。 单击页面左侧的“资源分组”。 在名称/ID列获取具体资源分组ID。 resource_id 否 String
在告警记录页面,可查看近7天触发的告警的信息。 单击操作列的“手动恢复”。 弹出确定手动恢复的对话框。 图1 手动恢复 单击“确定”,确定手动恢复。 当资源仍处于告警状态时,不建议执行手动恢复,此时如果执行手动恢复,则告警将在下一个告警频率时段内触发。 例如配置的告警频率为每1天告警一次
Agent支持的系统有哪些?。 支持的GPU加速型规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1。 暂不支持CCE纳管后的GPU加速型实例。 前提条件 已安装GPU驱动,未安装lspci工具的云服务器影响GPU掉卡事件的上报。 如果您的弹性云服务器未安
Agent插件状态显示“已停止”该如何处理? 查看Agent版本 使用root账号,登录ECS。 执行如下命令,确认使用Agent的版本。 if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope
查看是否有CESAgentAutoConfigAgency的委托。 如果没有且配额已满,请删除不需要的配额后再次进行Agent一键修复。 检查用户权限。 登录管理控制台。 单击“服务列表 > 统一身份认证服务”。 在左侧导航树选择“用户组”。 单击账号所属用户组“操作”列下的“权限配置”。 Agent安装需要有以下权限:
图4 查询Agent的Endpoint配置 执行如下命令,确认DNS解析是否正常。 ping ces.cn-south-1.myhuaweicloud.com 网络正常:排查结束。 网络无法访问:修改DNS配置或CES的终端节点。 各区域对应的云监控服务的Endpoint请参考“地区和终端节点”。
跟随修改。 自定义创建 模板 选择需要导入的模板。 您可以选择系统预置的默认告警模板,或者选择自定义模板。 - 告警策略 触发告警规则的告警策略。 当资源类型选择站点监控、日志监控、自定义监控、具体的云服务时,是否触发告警取决于连续周期的数据是否达到阈值。例如CPU使用率监控周期
ping agent.ces.myhuaweicloud.com 网络正常:排查结束。 网络无法访问:修改DNS配置或CES的终端节点。 各区域对应的云监控服务的Endpoint请参考“地区和终端节点”。 问题解决(Windows) 以administrator权限用户登录弹性云服务器或裸金属服务器。
为了更好监控弹性负载均衡服务,需要先开启负载均衡ELB的健康检查,详情参见健康检查异常如何排查?,建议设置负载均衡ELB网络流出速率的80%作为告警阈值。 建议将RDS的CPU使用率告警阈值设置为80%,连续三次超过阈值后开始告警。磁盘使用率、IOPS、使用中的数据库连接数等其他监控指标可根据您的实际情况来设置。