检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云服务监控 电商平台RDS、ELB、VPC等服务,可以使用云服务监控,在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。
弹性云服务器事件 弹性云服务器是作为一种可随时获取、弹性可扩展的计算服务器。在各业务中,弹性云服务器作核心基础,细微的性能变化,运行异常及自动恢复,都可能会引起云服务上的业务受到大幅震荡。 因此需使用弹性负载均衡将访问流量根据转发策略分发到后端多台弹性云服务器,通过流量分发扩展应
应用示例:用户自定义创建弹性云服务器CPU利用率告警 本章节用于指导用户在云监控服务为弹性云服务器创建告警规则,当弹性云服务器设置CPU使用率≥80%时触发告警。 创建步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入主机监控页面。 此时
云监控服务不需要开通,在创建弹性云服务器等资源后监控服务会自动启动,您可以直接到云监控服务查看该资源运行状态并设置告警规则。 主机监控: 通过在弹性云服务或裸金属服务器中安装云监控服务Agent插件,用户可以实时采集ECS或BMS 1分钟级粒度的监控数据。已上线CPU、内存和磁盘
未安装UVP VMTools对弹性云服务器监控指标有什么影响? 未安装UVP VMTools,云监控服务无法提供监控弹性云服务器的内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个指标。但可以监控带外网络流入速率和带外网络流出速率指标,这样导致CPU使用率指标的精确性可能会降低。
配置云服务器全部挂载点磁盘使用率告警规则 场景描述 云监控服务提供了配置云服务器全部挂载点告警规则的能力。本章节介绍了配置云服务器全部挂载点磁盘使用率告警规则的操作流程。 磁盘使用率指标调整为挂载点维度,在新配置磁盘使用率告警规则时需要选择“云服务器挂载点”维度。 如果选择了配置
支持监控的服务列表 分类 服务 命名空间 维度 监控指标参考文档 计算 弹性云服务器 SYS.ECS Key:instance_id Value:云服务器ID 弹性云服务器的基础监控指标 弹性云服务器中操作系统监控 AGT.ECS Key:instance_id Value:云服务器ID
念: 带外 带外:带外相对于带内。在云服务器中,“带内”表示监控的测量对象是弹性云服务器。“带外”表示监控的测量对象是虚拟化层面的物理服务器。 流入和流出 流入:表示以弹性云服务器为主体,每秒流入到弹性云服务器的流量。 流出:表示以弹性云服务器为主体,每秒流出到外部网络或客户端的流量。
查看云服务监控指标 云监控服务基于云服务自身的服务属性,已经内置了详细全面的监控指标。当您在云平台上开通云服务后,系统会根据服务类型自动关联该服务的监控指标,帮助您实时掌握云服务的各项性能指标,精确掌握云服务的运行情况。 本章节指导用户如何查看云服务资源的监控数据,若发现有异常时可以及时处理。
云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 因为云监控服务与弹性云服务器系统内指标检测软件的采样周期不同。 云监控服务对弹性云服务器、云硬盘的采样周期是4分钟(云服务器类型为KVM的是5分钟),而系统内工具的采样周期一般为1秒,远远小于云监控服务的采样周期。
机监控、云服务监控等页面创建导出任务,还可以前往主机监控页面创建Agent安装任务。 “监控数据导出”和“告警记录导出”中的导出任务会在创建时间7天后清除。 监控数据导出 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控 > 弹性云服务器”或“主机监控
硬件问题导致GPU卡链路异常,驱动无法使用GPU。 虚拟机GPU丢卡告警 vmLostGpuAlarm 重要 虚拟机实际有的GPU卡数量比规格里应分配的GPU卡数量少。 如果业务受损,请提交工单。 虚拟机GPU卡丢失。 GPU显存页告警 gpuMemoryPageFault 重要 GPU显存页发生故障,故障可能由应用、驱动或硬件引起。
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工
硬件问题导致GPU卡链路异常,驱动无法使用GPU。 虚拟机GPU丢卡告警 vmLostGpuAlarm 重要 虚拟机实际有的GPU卡数量比规格里应分配的GPU卡数量少。 如果业务受损,请提交工单。 虚拟机GPU卡丢失。 GPU显存页告警 gpuMemoryPageFault 重要 GPU显存页发生故障,故障可能由应用、驱动或硬件引起。
指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 表5 dimensions字段数据结构说明 名称 是否必选 参数类型 说明 name 是 String 监控维度名称,例如弹性云服务器的维度为i
resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 dimensions Arrays of objects 是 一个或者多个资源维度。 详细参数说明请参见表4。
namespace 否 资源命名空间,例如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 dname 否 资源维度,例如弹性云服务器维度为:instance_id,各资源的维度可查看支持监控的服务列表。 start 否 分页起始值,类型为integer,默认值为0。
只能包含0-9/a-z/A-Z/_/-或汉字,长度为1-128。 template_description 否 String 自定义告警模板详细描述,长度为0-256。 namespace 是 String 创建自定义告警模板选择的资源类型,即服务命名空间,如选择弹性云服务器,则命名空间为SYS.ECS。 dimension_name
2、Pi1、P1。 暂不支持CCE纳管后的GPU加速型实例。 前提条件 已安装GPU驱动,未安装lspci工具的云服务器影响GPU掉卡事件的上报。 如果您的弹性云服务器未安装GPU驱动,请参见GPU驱动概述安装GPU驱动。 安装GPU驱动需使用默认路径。 GPU驱动安装完后,需重
为什么云服务器看不到内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标? 当前创建的Linux云服务器,均不支持内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标。但Windows云服务器是支持这四个指标的。 不同操作系统支持的基础监控指标