检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置是否发送邮件、短信、HTTP和HTTPS通知用户。 通知方式 根据需要可选择通知组或主题订阅两种方式。 通知组 “通知方式”选择“通知组”时该参数出现。设置发送告警通知的通知组。创建通知组请参见创建通知对象/通知组。 通知对象 “通知方式”选择“主题订阅”时该参数出现。设置发送告警通知的对象,可选择云账号联系人或主题名称。
选择策略屏蔽时,需要先选择规则和选择策略后,再选择对象。 选择指标 仅当屏蔽方式为资源屏蔽时,可选择需要屏蔽告警的指标。 说明: 如果不指定指标,则对所有指标生效。 选择规则 仅当屏蔽方式为策略屏蔽时,可选择资源的告警规则。 选择策略 仅当屏蔽方式为策略屏蔽时,可选择一个或多个告警策略进行屏蔽。 屏蔽时间
消息通知方式。借助消息通知服务,云监控服务在监控到云服务资源发生变化时,通过多种方式通知用户,让用户实时掌握云服务的运行状况。 告警规则 告警规则是指用户对云服务的某个监控指标设置阈值,当告警规则的状态(告警、恢复正常)变化时,支持以邮箱、短信、HTTP、HTTPS等方式通知用户,避免因资源问题造成业务损失。
云监控插件(Agent) Agent安装配置方式说明 Agent版本特性 Agent安装说明 安装配置Agent 管理Agent 其他插件安装说明 升级Agent 父主题: 主机监控
务需求。 您可以参考本章节对这些不合理的告警规则设置进行调整。 告警规则简介 创建告警规则和通知 告警策略 修改告警规则 修改告警规则通知方式 停用告警规则 启用告警规则 删除告警规则 导出告警规则 父主题: 告警
指标管理接口授权项说明 权限 对应API接口 授权项 IAM项目 企业项目 查询系统当前可监控指标列表,可以指定指标命名空间、指标名称、维度、排序方式,起始记录和最大记录条数过滤查询结果。 GET /V1.0/{project_id}/metrics ces:metrics:list √
长度范围为1~32个字符。 统计方式 分为聚合值和原始值两种方式。 聚合值:支持通过最大值、最小值、平均值或求和值四种聚合方法聚合后导出数据。 原始值:导出原始数据。 时间区间 选择导出数据的时间范围。 聚合值最多可导出前90天的数据 原始值导出的最大时间区间为最近48小时 聚合区间 当统计方式为“聚合值”时需配置此参数。
在“自定义进程数”页面,展示了主机上运行的自定义进程数据。 表1 进程监控相关指标说明 指标名称 指标含义 取值范围 采集方式(Linux) 采集方式(Windows) CPU使用率 进程消耗的CPU百分比。 pHashId是(进程名+进程ID)的md5值。 0-1*cpu核心数
装Agent插件。 如何安装Agent插件? 首先需要从操作系统上区分一下,目前有Windows和Linux两种操作系统,安装Agent的方式有所区别: Windows类型机器安装Agent 只能使用手动安装,目前在CES的主机监控列表页面有用户安装指南,可进行参考。 直接单击单
改。 取值样例:noticeTemplate-d9wa 描述 告警通知模板描述(此参数非必填项)。 渠道类型 在下拉框中选择告警通知的通知方式,可选择“短信”、“邮件”、“HTTP(s)”、“SMN”。 通知类型 在下拉框中选择告警通知的通知类型,可选择“指标通知”、“事件通知”、“站点通知”、“广域网质量通知”。
由浅入深,带您玩转云监控 01 了解 了解华为云云监控服务的应用场景、相关概念和支持监控的服务列表,有助于您快速适配您的业务场景选择合适的资源监控方式和告警通知方式。 产品介绍 什么是云监控服务 云监控服务相关概念 支持监控的服务列表 服务优势 03 使用 为您全面展示华为云云监控服务的监控面板
Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束 BMS硬件监控指标采集说明 什么是插件修复配置? 怎样让新购ECS实例中带有操作系统监控功能?
配置告警通知 表3 配置告警通知 参数 参数说明 发送通知 配置是否发送邮件、短信、HTTP和HTTPS通知用户。 通知方式 根据需要可选择通知组或主题订阅两种方式。 通知组 需要发送告警通知的通知组。创建通知组请参见创建通知对象/通知组。 通知对象 需要发送告警通知的对象,可选择云账号联系人或主题名称。
已配置委托,配置方法参考如何配置委托?。 确保操作步骤中的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。 登录方式为账号密码:已收集需要安装Agent的所有主机的IP地址和root用户密码,按照iplist.txt格式整理好,并上传到第一台机器的/usr/local目录下
ps/{group_id} 参数说明 表1 参数说明 名称 类型 是否必选 说明 project_id String 是 项目ID。 获取方式请参见获取项目ID。 group_id String String 资源分组ID。 请求样例: DELETE https://{云监控的endpoint}/V1
BMS硬件监控指标采集说明 以下是BMS硬件监控插件对应的监控指标采集说明。 指标分类 指标说明 采集方式 服务器整机信息 服务器整机SN、产品名称、厂家等。 使用dmidecode命令采集。 SSD/HDD 基本信息和SMART信息 包含盘的基本信息。(SN、型号、容量、协议类型、固件版本等),以及盘的SMART
BMS实例缺失硬件监控插件会导致华为云无法第一时间感知实例的硬件故障,可能影响业务可用性时长,且故障需要用户主动联系技术支持处理。 当安装硬件监控插件后,硬件故障风险会以事件的方式主动通知到用户,需要用户及时授权对风险硬件的维修或更换。 监控插件实现硬件的故障风险检查时,仅会采集一些必要的系统指标用作巡检,详情见硬件监控指标采集说明。
指标名称:在下拉框中选择“CPU使用率”。 告警策略:平均值、监控周期5分钟、>=、80%、连续三个周期、每1天告警一次。 告警级别:重要。 发送通知:是。 通知方式:主题订阅。 通知对象:选择创建告警通知主题创建的主题。 生效时间:00:00-23:59 触发条件:依次勾选“出现告警”、“恢复正常”。
-template/{template_id} 参数说明 表1 参数说明 名称 是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 template_id 是 需要删除的自定义告警模板ID。 样例 DELETE https://{云监控的endpoint}/V1
新。 创建告警规则:用户对云服务的核心监控指标设置告警规则,当监控指标触发用户设置的告警条件时,支持以 邮箱、短信、HTTP、HTTPS等方式通知用户,让用户在第一时间得知云服务发生异常,迅速处理故障,避免因资源问题造成业务损失。 导出监控数据:云服务监控支持您在所选的区间和周期