检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修订记录 发布日期 修改记录 2021-06-16 配置云服务器全部挂载点磁盘使用率告警规则上线。 2020-03-09 使用资源分组和告警功能最佳实践上线。 2019-03-06 事件监控最佳实践上线。 2019-01-22 云监控在众包平台中的应用上线。 2018-09-30
BMS硬件监控指标采集说明 以下是BMS硬件监控插件对应的监控指标采集说明。 指标分类 指标说明 采集方式 服务器整机信息 服务器整机SN、产品名称、厂家等。 使用dmidecode命令采集。 SSD/HDD 基本信息和SMART信息 包含盘的基本信息。(SN、型号、容量、协议类型、固件版本等),以及盘的SMART
据该如何处理? Agent一键修复后无监控数据问题排查(老版本Agent) 如何获取Agent的Debug日志? Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 监控数据中会出现跳点的情况 入网带宽和出网带宽出现负值
10-10 00:00:00),包月资源包的余量更新为 100 万点次。 购买资源包 前提条件 已开通广域网质量监控。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“网络性能监控 > 广域网质量监控”。 单击右上角“购买资源包”。 在“广域网质量监控资源包
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
创建钉钉机器人请参考创建钉钉机器人,同时请您关注钉钉免费转商业化公告。 在通知对象中添加钉钉机器人 在通知对象中添加钉钉机器人的Webhook地址。 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警通知”,进入告警通知界面。 在“通知对象”页签,单击“创建通知对象”或单击已有通知对象的“编辑”操作进入配置页面。
云监控的支持自定义策略授权项如下所示: 表格中“√”表示支持,“×”表示暂不支持。 API版本号管理接口授权项说明 指标管理接口授权项说明 告警规则管理接口授权项说明 监控数据管理接口授权项说明 配额管理接口授权项说明 事件监控接口授权项说明 父主题: 权限和授权项
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
example.com为例,创建站点监控,并为站点的可用性、响应时间、丢包率创建告警规则,当发生异常时通知用户及时处理。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控”。 单击左侧导航栏的“站点监控”。 在“站点监控”界面,单击右上角“创建站点监控”,进入“创建站点监控”界面。
资源总数 最小值:0 最大值:100 表5 Resource 参数 参数类型 描述 namespace String 资源命名空间,例如弹性云服务器命名空间(格式为service.item;service和item必须是字符串,以字母开头,可包含0-9/a-z/A-Z/_;长度范围[3
单击添加。 单击复制,复制Webhook地址。 在通知对象中添加企业微信机器人 在通知对象中添加企业微信机器人的Webhook地址。 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警通知”,进入告警通知界面。 在“通知对象”页签,单击“创建通知对象”或单击已有通知对象的“编辑”操作进入配置页面。
原因1:API被流控。详见下方【案例一】 解决方法 若API被流控,需第一时间找运维人员配置新的流程策略。 案例一 API被流控 查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30 20:00:00到2019-04-30
资源监控是以资源分组维度横向展示和各个服务资源维度纵向分布,将各个资源的实时告警情况进行展示,用户可按照不同维度对资源告警进行关注,方便高效管理您的资源。 下面将介绍资源监控如何查看和使用。 在总览页面的左侧展示了全部资源的健康评分、资源总数和正在告警的资源数,正在告警的资源数按照告警级别展开。
单击复制,复制Webhook地址。 添加自定义关键词,确认无误后单击完成。 在通知对象中添加飞书机器人 在通知对象中添加飞书机器人的Webhook地址。 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警通知”,进入告警通知界面。 在“通知对象”页签,单击“创建通知对象”,或单击
屏蔽截止时间,HH:mm:ss。 表4 Resource 参数 是否必选 参数类型 描述 namespace 是 String 资源命名空间,例如弹性云服务器命名空间(格式为service.item;service和item必须是字符串,以字母开头,可包含0-9/a-z/A-Z/_;长度范围[3
Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 配置异常: ECS/BMS主机没有配置委托。 当前委托权限异常。 当前委托已失效。 默认网卡安全组规则配置错误或DNS配置错误。 已停止:Agent被手动停止,可参考管理Agent章节启动Agent。
子维度两种类型,推荐您使用云产品层级,两者介绍如下。 云产品(推荐):该方式将允许您在同一告警规则内配置多个维度的指标,如CPU使用率(云服务器维度)、磁盘使用率(挂载点维度)。 子维度:该方式只允许您在同一告警规则内配置单个维度的指标,2024年之前的产品能力,不推荐使用。 监控范围(监控对象)
修改记录 2023-10-12 第四十六次正式发布: 本次变更如下: 新增告警通知。 新增一键告警。 新增告警通知屏蔽。 新增CES资源标签管理。 2023-08-31 第四十五次正式发布: 本次变更如下: 新增监控看板。 新增监控视图。 新增插件状态查询。 新增Agent任务相关接口
屏蔽截止时间,HH:mm:ss。 表4 Resource 参数 是否必选 参数类型 描述 namespace 是 String 资源命名空间,例如弹性云服务器命名空间(格式为service.item;service和item必须是字符串,以字母开头,可包含0-9/a-z/A-Z/_;长度范围[3
次数为连续2次,比较关系为= 、阈值为80% 、告警频率为每5分钟告警一次。 表示:每5分钟收集一次 CPU 利用率的平均值数据,若某台云服务器的 CPU 利用率连续2次大于80%则每5分钟触发告警一次。 图1 告警策略 配置事件类告警策略 用户可以针对业务中的各类重要事件或对云