检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
企业项目的子用户无法看到一键告警功能 云监控服务的一键告警功能只有主账号或配置了Tenant Administrator权限的子用户才有权访问和使用。 如何为子账号设置Tenant Administrator权限,请参考创建用户组并授权。 父主题: 告警
主机监控配置监控及告警的全流程介绍 主机资源作为最重要的云上资源,如何做好对它的监控、告警,在实际的运维过程中尤为重要,本文主要介绍主机如何进行监控及配置告警。 应用场景 当用户购买了主机资源后,对于资源的运行状态需要进行必要的监控,以及对重点业务指标进行配置监控告警,能及时准确掌握主机资源的云上运行状态。
对象存储服务(Object Storage Service,以下简称OBS)后,可将原始数据同步保存至OBS,以保存更长时间。 本章节介绍如何配置数据存储。 仅支持旧版操作。 当前支持“配置数据存储”功能的区域有:华北-北京一、华东-上海二、华南-广州、华北-北京四,其余区域暂不支持。
认证用的AccessKey和SecretKey明文存储有很大的安全风险, 建议对该区域下所有云服务器或裸金属服务器安装的Agent做委托授权,委托方法请参考如何配置委托? { "InstanceId":"XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX", "ProjectId":
0.xx:8087"] # exporter节点地址:监听端口 params: services: [] 在安装目录下启动prometheus,对接exporter。 ./prometheus 本地默认登录地址为:http://127.0.0.1:9090/graph。
Linux 操作场景 本章节主要介绍如何将老架构的Agent升级到新架构Agent。 约束限制 不支持局点:华南-广州-友好用户环境、拉美-圣保罗一、拉美-墨西哥城一。 操作步骤 使用root账号,登录ECS。 执行如下命令,确认当前Agent的版本是新架构Uniagent还是老架构telescope。
主机恢复后,确认业务是否自动恢复。 影响数据读写业务或主机无法启动 云存储连接异常 storageError 重要 裸金属服务器云硬盘连接异常。包括: SDI卡故障 远端存储故障 业务应用做成高可用。 主机恢复后,确认业务是否自动恢复。 影响数据读写业务或主机无法启动 GPU存在infoROM告警 gpuInfoROMAlarm
Windows 操作场景 本章节主要介绍如何将老架构的Agent升级到新架构Agent。 约束限制 不支持局点:华南-广州-友好用户环境、拉美-圣保罗一、拉美-墨西哥城一。 操作步骤 使用具有“管理员”权限的账号(例如,administrator)登录Windows弹性云服务器。
为用户提供系统级、主动式、细颗粒度的GPU监控,包含GPU指标收集和GPU系统事件上报。GPU支持监控的指标,参见GPU指标。 本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版GPU监控插件: 操作步骤(单节点安装) 操作步骤(多节点批量安装) 约束与限制
AgentAccess CES Agent正常运行所需的必要权限。 说明: 为了保证CES Agent能够正常提供服务,需要配置委托,详细操作请参见如何配置委托? 系统策略 无。 CES SiteMonitor FullAccess 云监控服务站点监控所有权限。 系统策略 无。 CES SiteMonitor
怎样让新购ECS实例中带有操作系统监控功能? 操作场景 本章节指导用户如何让新购买的ECS实例带有操作系统监控功能。 制作的私有镜像不可跨Region使用,因为跨Region使用私有镜像创建的ECS实例无法取得监控数据。 前提条件 已有安装Agent的ECS实例。 操作步骤 进入
购买广域网质量监控资源包 操作场景 本章节指导用户如何购买广域网质量监控资源包。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“网络性能监控 > 广域网质量监控”。 单击右上角“购买资源包”。 在“广域网质量监控资源包”页面,可选择资源包类型、查看抵扣说明
创建屏蔽规则 操作场景 本章节用于指导如何创建屏蔽规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警屏蔽”,进入告警屏蔽界面。 单击页面右上角的“创建告警屏蔽”。 在“创建屏蔽规则”界面,根据界面提示配置参数,参数如表1所示。 图1 创建告警屏蔽
务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现监控指标的增加、修改、删除等日常操作。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“监控看板 >
创建告警规则和通知 本章节指导用户如何创建告警规则。 创建告警规则 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“告警 > 告警规则”。 单击“创建告警规则”。 在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置告警规则的基本信息 图1 基本信息 表1
Agent状态切换或监控面板有断点该如何处理? 业务端口被Agent占用该如何处理? Agent一键修复失败问题排查 Agent一键修复后无监控数据问题排查 上报的指标被丢弃问题排查 Agent插件状态显示“故障”该如何处理? Agent插件状态显示“已停止”该如何处理? Agent插件状态显示“运行中”但没有数据该如何处理?
目前SMN服务支持的传输协议中,“语音通知”、“钉钉群消息”、“企业微信群消息”、“飞书群消息”正处于公测阶段,如需使用需要提交工单申请开通公测,本文主要介绍如何在华为云官网提交工单开通上述渠道公测能力。 应用场景 创建通知对象、创建告警规则时需要配置通知渠道。 操作步骤 登录管理控制台。 选择“支持与服务”,单击左下方“工单服务”。
资源监控是以资源分组维度横向展示和各个服务资源维度纵向分布,将各个资源的实时告警情况进行展示,用户可按照不同维度对资源告警进行关注,方便高效管理您的资源。 下面将介绍资源监控如何查看和使用。 在资源监控页面的左侧展示了全部资源的健康评分、资源总数和正在告警的资源数,正在告警的资源数按照告警级别展开。 健康评分的计算
开通广域网质量监控 操作场景 本章节指导用户如何开通广域网质量监控。 开通广域网质量监控不会产生任何费用,当您使用广域网质量监控功能时,将按照实际使用量进行计费。 广域网质量监控目前在公测阶段,如需开通,请提交工单申请公测。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。
创建告警规则 应用场景 告警功能为您提供监控数据的告警服务。您可以通过创建告警规则来定义告警系统如何检查监控数据,并在监控数据满足告警策略时发送报警通知。 对重要监控指标创建告警规则后,便可在第一时间得知指标数据发生异常,迅速处理故障。 功能介绍 支持对云监控服务的所有监控项创建告警规则。