检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
多种通知方式 通过在告警规则中开启消息通知,当云服务的状态变化触发告警规则设置的阈值时,系统提供电话、短信、邮箱、企业微信、钉钉、飞书和Welink通知,还可以通过HTTP、HTTPS将告警信息发送至告警服务器,用户可以在第一时间知悉业务运行状况,便于构建智能化的程序处理告警。 批量创建告警规则
对于EVS相关指标数据,disk_name维度下,它的返回值有云服务器实例ID-盘符名和云服务器实例ID-volume-卷ID两种。 云服务器实例ID-盘符名,例如:6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d-vda(vda为盘符名)。 云服务器实例ID-volume-卷ID,例
无告警:组内未存在告警资源。 告警中:组内有资源正在告警。 未设置告警规则:组内所有资源均未设置告警规则。 事件告警状态 无告警:组内资源未触发事件。 已触发:组内有资源触发事件。 未设置告警规则:组内所有资源均未设置告警规则。 资源数(告警中/已触发/资源总数) 组内所有正在告
据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Agent上报数据时取的是ECS或BMS的操作系统本地时间,管理控制台下发的请求时间范围是依赖用户客户端浏览器的时间,两者如果不匹配则可能导致管理控制台查不到操作系统监控数据。 修改裸金属服务器和云监控服务时间一致参考命令:timedatectl
名称 参数类型 说明 name String 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。 value String 维度取值,例如弹性云服务器的ID。 长度最短为1,最大为256。 表6 meta_data字段数据结构说明
监控数据文件转储:需要使用对象存储服务(OBS),转储后的监控数据文件将永久保存。 发送告警通知:需要使用消息通知服务(SMN),当云服务的状态变化触发告警规则设置的阈值时,发送邮件、短信、HTTP、HTTPS告知用户。 增值服务的计费方式如下: 对象存储服务(OBS) 对象存储服务提供按需付费、包年
to 是 String 查询数据截止时间UNIX时间戳,单位毫秒。from必须小于to。 dim 是 String 监控维度,例如弹性云服务器的维度为instance_id。各服务监控指标对应的维度请参考支持监控的服务列表中对应服务的监控指标说明。 指标的维度,目前最大支持3
主机id 正则匹配:^[a-zA-Z0-9-]{1,64}$ instance_type 否 String 主机类型,ECS弹性云服务器,BMS裸金属服务器 枚举值: ECS BMS invocation_id 否 String 任务id 正则匹配:^([0-9A-Za-z]){1}([0-9A-Za-z]|_|-)*$
resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 dimensions Arrays of objects 是 一个或者多个资源维度。
取值范围:只能由中文、英文字母、数字、下划线、中划线组成。长度范围:1-128个字符。 取值样例:dataShareJob-ECSMetric 资源类型 云监控服务监控的资源类型。 取值样例:弹性云服务器。 维度 监控对象的范围。 各服务监控对象的维度值请参考监控指标说明页面的“监控指标”和“维度”表格中描述。
√ √ √ √ √ 安装Agent √(需同时拥有ECS FullAccess权限) × √ × √(需同时拥有ECS FullAccess权限) × 修复插件配置 √(需同时拥有Security Administrator、ECS FullAccess权限) × √ × √(需同时拥有Security
事件监控最佳实践 弹性云服务器事件 关系型数据库事件 弹性公网IP事件 父主题: 场景化实践案例
time 是 Long 事件发生时间。UNIX时间戳,单位毫秒。 说明: 因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 例如,当前时间为2020.01.30
告警 告警简介 告警规则 告警记录 告警模板 告警通知 应用示例:用户自定义创建弹性云服务器CPU利用率告警 一键告警 告警屏蔽
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
time Long 是 事件发生时间。UNIX时间戳,单位毫秒。 说明:因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 detail Detail object
告警历史的告警级别。值为1、2、3、4。其中1为紧急,2为重要,3为次要,4为提示。 namespace 否 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 from 否 查询告警历史的起始时间。UNIX时间戳,单位毫秒,如:160
查看云服务监控指标原始数据 操作场景 本节介绍如何在OBS中通过下载监控数据文件查看已保存至OBS桶的原始数据。 仅支持旧版云服务监控操作。 前提条件 已在云监控服务中成功配置数据存储。配置数据存储请参见配置数据存储。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。
电商平台业务监控 云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 使用资源分组和告警功能上报指定资源的监控指标 配置云服务器全部挂载点磁盘使用率告警规则
BMS硬件监控指标采集说明 以下是BMS硬件监控插件对应的监控指标采集说明。 指标分类 指标说明 采集方式 服务器整机信息 服务器整机SN、产品名称、厂家等。 使用dmidecode命令采集。 SSD/HDD 基本信息和SMART信息 包含盘的基本信息。(SN、型号、容量、协议类型、固件版本等),以及盘的SMART