检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
电商平台业务监控 云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 使用资源分组和告警功能上报指定资源的监控指标 配置云服务器全部挂载点磁盘使用率告警规则
告警触发方式 一键告警 当重要事件发生时,立即触发告警通知。 优势:配置简单,一键式打开开关。 弹性云服务器、弹性公网IP和关系型数据库的重要事件。 事件监控 指标监控 立即触发 普通告警 根据设置的告警策略触发告警。例如:CPU利用率在5分钟内的平均值连续5次>=80%时发送告警通知。
告警历史的告警级别。值为1、2、3、4。其中1为紧急,2为重要,3为次要,4为提示。 namespace 否 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 from 否 查询告警历史的起始时间。UNIX时间戳,单位毫秒,如:160
修订记录 发布日期 修改记录 2021-06-16 配置云服务器全部挂载点磁盘使用率告警规则上线。 2020-03-09 使用资源分组和告警功能最佳实践上线。 2019-03-06 事件监控最佳实践上线。 2019-01-22 云监控在众包平台中的应用上线。 2018-09-30
1m # 设置prometheus从exporter查询数据的间隔时间,prometheus配置文件中默认为15s,建议设置为1m scrape_timeout: 1m # 设置从exporter查询数据的超时时间,prometheus配置文件中默认为15s,建议设置为1m scrape_configs:
time Long 是 事件发生时间。UNIX时间戳,单位毫秒。 说明:因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 detail Detail object
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
不支持局点:华南-广州-友好用户环境、拉美-圣保罗一、拉美-墨西哥城一。 Linux平台操作步骤 Windows平台操作步骤 使用root账号,登录ECS。 执行如下命令,确认当前Agent的版本是新架构Uniagent还是老架构telescope。 if [[ -f /usr/local/
BMS硬件监控指标采集说明 以下是BMS硬件监控插件对应的监控指标采集说明。 指标分类 指标说明 采集方式 服务器整机信息 服务器整机SN、产品名称、厂家等。 使用dmidecode命令采集。 SSD/HDD 基本信息和SMART信息 包含盘的基本信息。(SN、型号、容量、协议类型、固件版本等),以及盘的SMART
告警记录 查看告警记录详情 手动恢复告警记录 父主题: 告警
status 否 String 按状态信息进行过滤,取值只能为health(已设置告警规则且无告警触发的资源)、unhealthy(已设置告警规则且有告警触发的资源)、no_alarm_rule(未设置告警规则的资源) 枚举值: health unhealthy no_alarm_rule
快速入门 概述 本节通过调用一系列云监控的API为ECS的cpu_util指标创建告警规则,当指标的数值达到设置的阈值时及时通知用户处理。 通过IAM服务获取到的Token有效期为24小时,需要使用同一个Token鉴权时,可以先将Token缓存,避免频繁调用。 操作步骤 Token认证,具体操作请参考认证鉴权。
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
String 创建告警规则时选择的资源分组名称,如:Resource-Group-ECS-01 表4 dimensions字段数据结构说明 名称 参数类型 说明 name String 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。
Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。
云监控服务哪些资源支持企业项目? 目前,支持按企业项目分权分域的有:我的看板、资源分组、告警规则、可用性监控、云服务监控、站点监控和广域网质量监控。 父主题: 云服务监控
修改告警规则 当用户业务发生变更或需要对已创建的告警规则进行重新规划时,可以对告警规则进行修改。本章节介绍如何修改告警规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警规则”,进入告警规则界面。 你可以选择以下两个路径进入告警规则修改页面:
Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。
bel,如ECS实例会增加hostname、ip等label,同时支持将华为云标签转化为label,满足对资源自定义label的诉求,具体如下表所示。 表1 拓展标签支持情况 云服务 命名空间 是否支持拓展标签 标签数据来源 弹性云服务器 SYS.ECS/AGT.ECS √ 配置审计或弹性云服务器
资源总数 最小值:0 最大值:100 表5 Resource 参数 参数类型 描述 namespace String 资源命名空间,例如弹性云服务器命名空间(格式为service.item;service和item必须是字符串,以字母开头,可包含0-9/a-z/A-Z/_;长度范围[3