检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
单击资源分组列表中待查看的分组名称,进入该资源分组的“资源概览”界面。 单击右侧的“告警规则”,即可展示该资源分组下的全部告警规则。 在该资源分组的“告警规则”界面中,可快速创建资源分组的告警规则。具体创建步骤请参见创建告警规则和通知。 图1 资源分组中的告警规则 父主题: 查看资源分组
gpu硬件、驱动、应用问题导致Xid事件,可能导致业务异常退出。 nvidia-smi命令卡住 nvidiaSmiHangEvent 重要 nvidia-smi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。
修改站点监控”,或者则勾选多个监控站点,单击列表上方的“修改”。 进入“修改监控站点”界面。 根据界面提示配置参数,参数如表1所示。 站点类型与站点地址不能修改,因不同站点类型高级配置信息不同,切换后可能会丢失数据。 单击“确定”,完成修改。 停用站点监控 在“站点监控”界面,单击站点所在行的“更多 > 停用站点
gpu硬件、驱动、应用问题导致Xid事件,可能导致业务异常退出。 nvidia-smi命令卡住 nvidiaSmiHangEvent 重要 nvidia-smi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。
企业项目的子用户无法看到一键告警功能 云监控服务的一键告警功能只有主账号或配置了Tenant Administrator权限的子用户才有权访问和使用。 如何为子账号设置Tenant Administrator权限,请参考创建用户组并授权。 父主题: 告警
在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置告警规则基本信息。 表1 广域网质量监控告警规则基本信息配置说明 参数 参数说明 名称 系统会随机产生一个名称,用户也可以进行修改。 描述 告警规则描述(此参数非必填项)。 选择监控对象,配置告警内容参数。 图1 配置广域网质量监控的告警内容
告警模板”,进入告警模板界面。 在“告警模板”界面,单击“创建自定义模板”。 在“创建自定义告警模板”界面,参考表1进行参数配置。 图1 创建自定义告警模板 表1 配置参数 参数 参数说明 名称 系统会随机产生一个模板名称,用户也可以进行修改。 取值样例:alarmTemplate-c6ft
自定义创建,自定义创建会根据选择的云产品将对应云产品的监控指标展示出来进行配置告警。 配置发送通知,通知方式可以选择通知策略、通知组、主题订阅。 配置完成后,单击立即创建,即可完成对该云服务的告警规则配置。 图6 创建告警规则 查看云服务的告警记录 当接收到告警通知后,可在告警记
删除告警规则 功能介绍 删除一条告警规则。 告警规则V1接口只支持配置单资源单策略规则,建议使用批量删除告警规则与前端功能配套使用。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
启停告警规则 功能介绍 启动或停止一条告警规则。 告警规则V1接口只支持配置单资源单策略规则,建议使用批量启停告警规则与前端功能配套使用。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
查询单条告警规则信息 功能介绍 根据告警ID查询告警规则信息。 告警规则V1接口只支持配置单资源单策略规则,建议使用查询告警规则列表(推荐)、查询告警规则资源列表与前端功能配套使用。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
insufficientdata_actions(该参数已废弃,建议无需配置)、ok_actions至少有一个不能为空。 若alarm_actions、insufficientdata_actions(该参数已废弃,建议无需配置)、ok_actions同时存在时,notificationList值保持一致。
Agent一键修复失败问题排查 问题现象 安装主机监控Agent后,单击“修复插件配置”后,插件状态仍然是“配置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /u
单击“告警 > 告警屏蔽”,进入告警屏蔽界面。 单击页面右上角的“创建告警屏蔽”。 在“创建屏蔽规则”界面,根据界面提示配置参数,参数如表1所示。 图1 创建告警屏蔽 表1 配置参数 参数 参数说明 名称 屏蔽规则的名称。 屏蔽方式 根据需要可选择资源屏蔽、策略屏蔽或事件屏蔽的方式。 云产品
告警中、已解决、数据不足、已触发、已失效。 告警中:监控指标数值达到告警配置阈值,资源正在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致; 已触发:监控的资源触发了告警策略中配置的事件; 已失效:告警规则中监控的资
大盘详情中配置监控视图。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“我的看板 > 监控大盘”。 在“监控大盘”界面,单击操作列的“查看”,进入云服务监控大盘页面。 在云服务监控大盘页面,可以查看监控大盘的监控视图。同时支持添加、配置、删除监控
Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 安装配置Agent成功,需要等待2分钟,管理控制台上才会有操作系统监控数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Ag
insufficientdata_actions(该参数已废弃,建议无需配置)、ok_actions至少有一个不能为空。 若alarm_actions、insufficientdata_actions(该参数已废弃,建议无需配置)、ok_actions同时存在时,notificationList值保持一致。
可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录CES的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CES支持审计的操作事件请参见云审计服务支持的Cloud Eye操作列表。