检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
站点监控 针对大量的静态数据,如产品图片,产品视频等导致不同网络用户访问电商网站出现网页打开慢、网络延时高等问题。可以使用站点监控对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的
使用资源分组 应用场景 业务视角管理资源 使用资源分组,方便用户将云账户下各类资源按业务分类,从业务角度出发查询监控与告警信息。 日常巡检与故障快速定位 资源分组提供资源概览、不健康资源列表、告警规则、告警记录等功能。方便用户查看云资源使用情况,收到报警后迅速定位故障资源与故障原因
配置指标告警 您可以对主机监控、云服务监控中的指标项设置告警规则。您可以在不同的监控对象层级(全部资源、资源分组、指定实例维度)设置告警规则。 前提条件 请确保您已拥有云监控服务的操作权限,能够创建告警规则。 资源层级 配置告警时,您需要指定监控对象的资源层级,资源层级分为云产品和子维度两种类型
认证鉴权 调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证调用请求。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。推荐使用AK/SK认证,其安全性比Token认证要高
构造请求 本节介绍REST API请求的组成,并以调用IAM服务的获取用户Token来说明如何调用API,该API获取用户的Token,Token可以用于调用其他API时鉴权。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com
使用的DNS非华为云DNS,请通过执行dig+目标域名获取到agent.ces.myhuaweicloud.com在华为云内网DNS下解析到的IP后再添加对应的hosts。请将Agent更新为最新版本。
将实时监控数据接入自建Prometheus 部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件
应用示例:用户自定义创建弹性云服务器CPU利用率告警 本章节用于指导用户在云监控服务为弹性云服务器创建告警规则,当弹性云服务器设置CPU使用率≥80%时触发告警。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入主机监控页面。 此时页面上显示了当前云平台上的弹性云服务器列表
创建告警规则和通知 当您需要监控各云服务资源的使用情况或云服务资源的关键操作时,可以创建告警规则。告警规则添加完成后,当监控指标触发设定的阈值或者事件发生时,云监控服务会在第一时间通过消息通知服务实时告知您云上资源异常,以免因此造成业务损失。 本章节指导用户如何创建告警规则。 创建告警规则
Agent一键修复失败问题排查 问题现象 安装主机监控Agent后,单击“修复插件配置”后,插件状态仍然是“配置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /usr
Agent一键修复失败问题排查 问题现象 安装主机监控Agent后,单击“修复插件配置”后,插件状态仍然是“配置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /usr
创建站点监控的告警通知 操作场景 本章节指导用户对已创建的站点进行告警规则的配置。通过配置告警规则,可以在出现异常状态时立马告警,并收到服务故障信息。 前提条件 已创建站点监控。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务 > 站点监控”。 单击监控站点所在行的“创建告警规则
创建告警规则 应用场景 告警功能为您提供监控数据的告警服务。您可以通过创建告警规则来定义告警系统如何检查监控数据,并在监控数据满足告警策略时发送报警通知。 对重要监控指标创建告警规则后,便可在第一时间得知指标数据发生异常,迅速处理故障。 功能介绍 支持对云监控服务的所有监控项创建告警规则
事件监控支持的事件说明 表1 弹性云服务器 事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 ECS SYS.ECS 因系统故障触发重部署 startAutoRecovery 重要 弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常的物理机
基础监控与操作系统监控数据出现不一致的问题 现象 基础监控显示CPU使用率90%以上,接近100%,操作系统内监控的CPU使用率不到50%,两者相差较大。 原因 如果您在操作系统(Guest OS)中配置idle=poll,当操作系统内部空闲时,进入polling状态消耗计算资源,
监控大盘简介 监控大盘是根据一些重点云服务的资源水位使用情况、核心业务指标的推荐,内置的默认监控看板。用户仅需简单的开启大盘即可创建完成重点服务的看板视图,方便可视化观测云上资源的各类核心重点指标数据。 监控大盘适用于对重点云服务资源有整体资源监控使用情况观测的场景。若您想要快速对整体资源进行视图创建
告警屏蔽简介 告警屏蔽指云监控根据屏蔽规则对告警触发后的通知消息进行屏蔽,屏蔽生效后仅产生告警记录将不会接收到告警通知。 告警屏蔽主要针对云资源中触发的无效告警、或用户已知问题或故障导致的重复告警,以及用户识别的一些频繁但不重要的告警,为减少这类告警对运维的干扰,可以通过告警屏蔽进行处理
创建监控大盘 当您需要观测云服务的整体资源监控使用情况时,可以根据需要选择监控大盘模板创建监控大盘,可视化观测云上资源的各类核心重点指标数据。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“我的看板 > 监控大盘”。 在“监控大盘”界面,单击右上角的
资源网络拓扑 网络资源拓扑功能提供一个直观、全面的视图,展示网络中各个资源之间的连接关系。该功能通过图形化界面,帮助租户快速了解网络结构。 当前拓扑资源支持虚拟私有云(VPC)、路由表(Routetable)、子网(Subnet)、弹性云服务器(ECS)、弹性负载均衡(ELB)、对等连接
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现监控指标的增加、修改、删除等日常操作。 操作步骤 登录管理控制台。 单击“服务列表