检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
企业项目的子用户无法看到一键告警功能 云监控服务的一键告警功能只有主账号或配置了Tenant Administrator权限的子用户才有权访问和使用。 如何为子账号设置Tenant Administrator权限,请参考创建用户组并授权。 父主题: 告警
提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件 请保证线下环境与云监控网络互通。 操作步骤 下载、安装并配置CES Exporter。 具体操作请参考安装配置CES Exporter。 下载、安装并配置Prometheus。 具
安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 账号欠费。 Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 配置异常: ECS/BMS主机没有配置委托。 当前委托权限异常。
Dashboards”,鼠标滑过需要修改的监控看板,在待配置的“监控视图”区域右上角单击“配置”图标,弹出“配置监控视图”页面。 在该页面,用户可以对监控视图标题进行编辑,也可以增加监控指标、删除监控指标或修改当前已添加的监控指标。 图1 配置监控视图 目前单个“监控视图”最多支持添加50个监控指标。
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现在拆线图和条形图中完成监控指标的增加、修改、删除等日常操作。 曲线图的操作步骤
板的添加。本章节介绍如何创建自定义告警/事件模板。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“告警 > 告警模板”,进入告警模板界面。 在“告警模板”界面,单击“创建自定义模板”。 在“创建自定义告警模板”界面,参考表1进行参数配置。 图1 创建自定义告警模板
GPU:Ant系列机器动态路由配置错误 GpuRouteConfigError 重要 Ant系列机器网卡%s动态路由未配置或配置错误,CMD [ip route]: %s | CMD [ip route show table all]: %s。 请正确配置RoCE网卡路由 NPU网络通信异常
云监控服务”。 在左侧导航树中选择“数据转储”。 单击“添加数据转储任务”。 在“添加转储任务”页面根据界面提示配置参数,参数说明如表1所示。 图1 添加转储任务 表1 转储任务配置参数说明 参数 参数说明 名称 转储任务名。 取值范围:只能由中文、英文字母、数字、下划线、中划线组成。长度范围:1-128个字符。
GPU:Ant系列机器动态路由配置错误 GpuRouteConfigError 重要 Ant系列机器网卡%s动态路由未配置或配置错误,CMD [ip route]: %s | CMD [ip route show table all]: %s。 请正确配置RoCE网卡路由 NPU网络通信异常
创建/修改/删除通知策略 通知策略能够配置分级和排班策略,能够在策略中配置接收对象和通知内容模板。本章节介绍如何创建、修改和删除通知策略。 创建通知策略 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警通知”,进入告警通知界面。 在“通知策略”页签,单击
HTTP/HTTPS 触发规则 选择配置告警策略的方式,当配置指标类告警规则或系统事件类告警规则时,支持选择关联模板和自定义创建两种方式,当配置自定义事件类、站点、广域网质量、可用性告警规则时,只支持自定义创建。 自定义创建:用户根据需要自定义配置告警策略。告警策略配置方法请参考告警策略。 关
优势:告警策略更加灵活,可根据业务情况灵活配置。 所有支持监控的服务。 主机监控 云服务监控 自定义监控 站点监控 日志监控 累计触发 当事件发生时,立即触发或者累计触发告警通知。 优势:灵活配置,仅支持事件告警。 支持的事件请参考事件监控支持的事件说明。 事件监控 立即触发或累计触发(可配置) 约束和限制
用于指导如何创建屏蔽规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警屏蔽”,进入告警屏蔽界面。 单击页面右上角的“创建告警屏蔽”。 在“创建屏蔽规则”界面,根据界面提示配置参数,参数如表1所示。 图1 创建告警屏蔽 表1 配置参数 参数
创建广域网质量监控 通过使用广域网功能配置定时拨测任务,选择分布在全球的探测点对域名进行拨测,并根据协议拨测结果状态码识别服务的可用性。本章节指导用户如何创建广域网质量监控任务。 前提条件 已开通广域网质量监控。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“网络性能监控
警通知。下面将展示如何配置指标类和事件类的告警策略。 配置指标类告警策略 用户可以针对云服务的核心监控指标设置指标告警,在发生异常时及时通知您采取措施。指标类告警策略包括指标名称、指标值类型、连续触发次数、阈值和告警频率五个必要组成部分。您可以根据以下指引配置告警类告警策略。 基本概念
发布区域:以控制台实际上线区域为准 Agent支持的系统都有哪些? 安装Agent 站点监控 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。其提供简单的添加配置,不再浪费资源和精力配置复杂的开源产品。并且支持站点异常告警,不用担心网站出问题而无人知晓。
可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录CES的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CES支持审计的操作事件请参见云审计服务支持的Cloud Eye操作列表。
配置云服务器全部挂载点磁盘使用率告警规则 场景描述 云监控服务提供了配置云服务器全部挂载点告警规则的能力。本章节介绍了配置云服务器全部挂载点磁盘使用率告警规则的操作流程。 磁盘使用率指标调整为挂载点维度,在新配置磁盘使用率告警规则时需要选择“云服务器挂载点”维度。 如果选择了配置
导出告警规则 如果需要查看当前账号下资源配置的告警规则信息,可以导出告警规则。本章节指导用户如何导出告警规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警规则”,进入“告警规则”界面。 单击左上角的“导出”按钮。 在弹出的“导出告警规则”
手动恢复是指用户在控制台上通过人工干预来确认问题已经被解决,并将该告警状态改为“已解决(手动)”。此操作存在风险,只用于特殊场景,一般不建议做手动恢复。本章节指导用户如何手动恢复告警记录。 约束与限制 告警状态为告警中、已触发或数据不足时,可手动恢复告警记录。 操作步骤 登录管理控制台。 单击“服务列表 >