检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
item,根据实际情况自定义配置。 service和item必须是字符串,必须以字母开头,只能包含0-9/a-z/A-Z/_,service.item总长度最短为3,最大为32。 time 是 Long 事件发生时间。UNIX时间戳,单位毫秒。 说明: 因为客户端到服务器端有延时,因此插入
创建自定义告警模板选择的资源类型,即服务命名空间,如选择弹性云服务器,则命名空间为SYS.ECS。 须知: 当选择的资源类型为“弹性云服务器中操作系统监控”,命名空间必须为SYS.ECS。 dimension_name 是 String 资源类型对应的指标监控维度,选择弹性云服务器,则维度为云服务器,dimensio
云监控服务”。 单击“告警 > 告警通知”,进入告警通知界面。 在“通知内容模板”页签,单击“创建通知内容模板”,根据界面提示配置参数。 根据界面提示,配置告警通知内容模板的基本信息。 图1 基本信息 表1 基本信息 参数 参数说明 模板名称 系统会随机产生一个通知模板名称,用户也可以进行修改。
单击“告警 > 告警屏蔽”,进入告警屏蔽界面。 单击页面右上角的“创建告警屏蔽”。 在“创建屏蔽规则”界面,根据界面提示配置参数,参数如表1所示。 图1 创建告警屏蔽 表1 配置参数 参数 参数说明 名称 屏蔽规则的名称。 屏蔽方式 根据需要可选择资源屏蔽、策略屏蔽或事件屏蔽的方式。 云产品
名称 参数类型 说明 name String 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。 value String 维度取值,例如弹性云服务器的ID。 长度最短为1,最大为256。 表6 meta_data字段数据结构说明
String 创建自定义告警模板选择的资源类型,即服务命名空间,如选择弹性云服务器,则命名空间为SYS.ECS。 dimension_name 是 String 资源类型对应的指标监控维度,选择弹性云服务器,则维度为云服务器,dimension_name值为instance_id。 template_items
已完成云监控主机监控Agent的安装,请参考安装Agent(Linux)。 已完成插件修复。 已获取待安装插件的弹性云服务器的root密码。 使用一键安装脚本配置插件 华为云部分区域支持使用一键安装脚本来配置插件,目前支持一键安装脚本的区域如表2所示。 使用root账号,登录ECS。 执行如下命令
修改站点监控”,或者则勾选多个监控站点,单击列表上方的“修改”。 进入“修改监控站点”界面。 根据界面提示配置参数,参数如表1所示。 站点类型与站点地址不能修改,因不同站点类型高级配置信息不同,切换后可能会丢失数据。 单击“确定”,完成修改。 停用站点监控 在“站点监控”界面,单击站点所在行的“更多 > 停用站点
namespace String 否 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 dname String 否 自定义告警模板选择的资源维度,例如弹性云服务器维度为instance_id。各服务的监控维度可查看支持监控的服务列表。
云监控服务”。 选择“网络性能监控 > 广域网质量监控”。 在“监控任务”页面,单击“创建任务”。 根据界面提示,配置广域网质量监控的基础信息。 图1 填写基础信息 表1 配置基本信息 参数 参数说明 取值样例 名称 系统会随机产生一个名称,用户也可以进行修改。 availabilityMonitor-wi4t
优势:配置简单,一键式打开开关。 弹性云服务器、弹性公网IP和关系型数据库的重要事件。 事件监控 指标监控 立即触发 普通告警 根据设置的告警策略触发告警。例如:CPU利用率在5分钟内的平均值连续5次>=80%时发送告警通知。 优势:告警策略更加灵活,可根据业务情况灵活配置。 所有支持监控的服务。
命名空间 维度 监控指标参考文档 计算 弹性云服务器 SYS.ECS Key:instance_id Value:云服务器ID 弹性云服务器的基础监控指标 弹性云服务器中操作系统监控 AGT.ECS Key:instance_id Value:云服务器ID Key:disk Value:磁盘
7976931348623157e+108。具体阈值取值请参见附录中各服务监控指标中取值范围,如支持监控的服务列表中ECS的CPU使用率cpu_util取值范围可配置80。 unit 否 String 数据的单位,最大长度为32位。 count 是 Integer 触发告警的连续发生次数,取值范围[1
BMS硬件监控指标采集说明 以下是BMS硬件监控插件对应的监控指标采集说明。 指标分类 指标说明 采集方式 服务器整机信息 服务器整机SN、产品名称、厂家等。 使用dmidecode命令采集。 SSD/HDD 基本信息和SMART信息 包含盘的基本信息。(SN、型号、容量、协议类型、固件版本等),以及盘的SMART
修改prometheus中的prometheus.yml文件配置。如下配置所示在scrape_configs下新增job_name名为“huaweicloud”的节点。其中targets中配置的是访问cloudeye-exporter服务的ip地址和端口号,services配置的是你想要监控的服务,比如SYS
ces.0429 可能原因 原因1:API被流控。详见下方【案例一】 解决方法 若API被流控,需第一时间找运维人员配置新的流程策略。 案例一 API被流控 查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30
单实例转主备实例失败 即创建备机或者备机创建完成后在主备机之间配置同步有故障,一般是由于备节点所在数据中心资源不足导致,转主备失败不会导致原来单实例的读写中断,客户的应用是无感知的。 提交工单处理。 复制状态异常已恢复 即复制时延已回到正常范围内,或者主备之间的网络通信恢复。 不需要处理。 实例运行状态异常已恢复
第六十四次正式发布: 新增BMS硬件监控插件说明章节。 下线安装GPU ECC监控插件(Linux)章节。 2023-08-21 第六十三次正式发布: 更新Agent版本特性章节。 优化Agent安装说明章节。 下线一键配置插件说明章节。 下线安装GPU指标与RAID指标采集插件采集插件(Linux)章节。
time Long 是 事件发生时间。UNIX时间戳,单位毫秒。 说明:因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 detail Detail object
告警历史的告警级别。值为1、2、3、4。其中1为紧急,2为重要,3为次要,4为提示。 namespace 否 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 from 否 查询告警历史的起始时间。UNIX时间戳,单位毫秒,如:160