检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
警规则设置的阈值时,系统提供电话、短信、邮箱、企业微信、钉钉、飞书和Welink通知,还可以通过HTTP、HTTPS将告警信息发送至告警服务器,用户可以在第一时间知悉业务运行状况,便于构建智能化的程序处理告警。 批量创建告警规则 告警模板可以帮助用户为多个云服务快速创建告警规则,极大的提高了维护人员的工作效率。
to 是 String 查询数据截止时间UNIX时间戳,单位毫秒。from必须小于to。 dim 是 String 监控维度,例如弹性云服务器的维度为instance_id。各服务监控指标对应的维度请参考支持监控的服务列表中对应服务的监控指标说明。 指标的维度,目前最大支持3
BMS硬件监控指标采集说明 以下是BMS硬件监控插件对应的监控指标采集说明。 指标分类 指标说明 采集方式 服务器整机信息 服务器整机SN、产品名称、厂家等。 使用dmidecode命令采集。 SSD/HDD 基本信息和SMART信息 包含盘的基本信息。(SN、型号、容量、协议类型、固件版本等),以及盘的SMART
主机id 正则匹配:^[a-zA-Z0-9-]{1,64}$ instance_type 否 String 主机类型,ECS弹性云服务器,BMS裸金属服务器 枚举值: ECS BMS invocation_id 否 String 任务id 正则匹配:^([0-9A-Za-z]){1}([0-9A-Za-z]|_|-)*$
指标数据保留多长时间? 指标数据分为原始指标数据和聚合指标数据。 原始指标数据是指原始采样指标数据,原始指标数据一般保留2天。 聚合指标数据是指将原始指标数据经过聚合处理后的指标数据,聚合指标数据保留时间根据聚合周期不同而不同,通过API获取的聚合指标数据保留时间如下: 表1 聚合指标数据保留时间
Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。
云监控Console页面查看您的云产品运行状态和相关指标数据,并对监控项创建告警规则。 主机监控 通过监控ECS或BMS的CPU使用率、内存使用率、磁盘等基础指标,确保ECS或BMS的正常使用,避免因为对资源的过度使用造成业务无法正常运行。 处理异常场景 云监控服务会根据您创建的
resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 dimensions Arrays of objects 是 一个或者多个资源维度。
告警规则适用的告警类型,可选择指标或者事件告警。 指标 资源类型 配置告警规则监控的服务名称。 弹性云服务器 维度 用于指定告警规则对应指标的维度名称 云服务器 监控范围 告警规则适用的资源范围。 指定资源 监控对象 监控对象为当前选择的弹性云服务器,无需配置。 - 触发规则 自定义创建:当告警类型选择事件,且事
告警 告警简介 告警规则 告警记录 告警模板 告警通知 应用示例:用户自定义创建弹性云服务器CPU利用率告警 一键告警 告警屏蔽
电商平台业务监控 云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 使用资源分组和告警功能上报指定资源的监控指标 配置云服务器全部挂载点磁盘使用率告警规则
Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 配置异常: ECS/BMS主机没有配置委托。 当前委托权限异常。 当前委托已失效。 默认网卡安全组规则配置错误或DNS配置错误。 已停止:Agent被手动停止,可参考管理Agent章节启动Agent。 父主题: 主机监控
String 创建告警规则时选择的资源分组名称,如:Resource-Group-ECS-01 表4 dimensions字段数据结构说明 名称 参数类型 说明 name String 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。
修订记录 发布日期 修改记录 2021-06-16 配置云服务器全部挂载点磁盘使用率告警规则上线。 2020-03-09 使用资源分组和告警功能最佳实践上线。 2019-03-06 事件监控最佳实践上线。 2019-01-22 云监控在众包平台中的应用上线。 2018-09-30
资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
无告警:组内资源未触发事件。 已触发:组内有资源触发事件。 未设置告警规则:组内所有资源均未设置告警规则。 资源数(告警中/已触发/资源总数) 组内所有正在告警的资源数/已触发告警的资源数/组内所有资源的数量。 资源类型数 组内资源类型的数量,例如组内有2台弹性云服务器 、1个云硬盘两种资源类型,则资源类型数为2。
不支持局点:华南-广州-友好用户环境、拉美-圣保罗一、拉美-墨西哥城一。 操作步骤 使用具有“管理员”权限的账号(例如,administrator)登录Windows弹性云服务器。 根据Agent安装路径判断当前Agent版本,方法参见Windows平台。 卸载当前版本的Agent,卸载命令参见卸载Agent。
告警类型 告警规则适用的告警类型,可选择指标或者事件告警。 指标 资源类型 配置告警规则监控的服务名称。 弹性云服务器 维度 用于指定告警规则对应指标的维度名称。 云服务器 监控范围 告警规则适用的资源范围,可选择全部资源、资源分组或指定资源。 说明: 选择“全部资源”时,则任何
资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
原因1:API被流控。详见下方【案例一】 解决方法 若API被流控,需第一时间找运维人员配置新的流程策略。 案例一 API被流控 查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30 20:00:00到2019-04-30