检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 因为云监控服务与弹性云服务器系统内指标检测软件的采样周期不同。 云监控服务对弹性云服务器、云硬盘的采样周期是4分钟(云服务器类型为KVM的是5分钟),而系统内工具的采样周期一般为1秒,远远小于云监控服务的采样周期。
中包含该时间分片下某一个资源下所有指标的监控数据,以Json格式存储。 为了方便用户使用,云监控服务为用户提供了格式转换以及内容拼接工具。使用该工具,用户可以把某一个特定资源下的若干个时间片的文件按照时间序列合并为一个按时间拼接的文件,文件格式为csv。同时可以对资源下的每个指标
Prometheus是用于展示大型测量数据的开源可视化工具,在工业监控、气象监控、家居自动化和过程管理等领域也有着较广泛的用户基础。将华为云Cloudeye服务接入prometheus后,您可以利用 prometheus更好地监控和分析来自 Cloudeye服务的数据。 Grafana是一个开源的可视化和分析
GPU驱动正常安装后,最多10分钟将在控制台看到采集到的GPU指标数据。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法,请参见安装lspci工具。 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
安装配置CES Exporter Prometheus是用于展示大型测量数据的开源可视化工具,在工业监控、气象监控、家居自动化和过程管理等领域也有着较广泛的用户基础。将华为云Cloud Eye服务接入Prometheus后,您可以利用Prometheus更好地监控和分析来自Cloud
s、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法如下 登录弹性云服务器。 更新镜像源,获取安装依赖。 wget http://mirrors
查询告警记录列表 功能介绍 查询告警记录列表 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/alarm-histories
的权限。 图1 修改CES授权范围 功能优势 支持创建、修改、停用、启用、删除站点监控。 提供简单的添加配置,不再浪费资源和精力配置复杂的开源产品。 支持站点异常告警,不用担心网站出问题而无人知晓。 命名空间 SYS.REMOTE_CHECK 监控指标 表1 站点监控指标说明 指标ID
Agent插件状态显示“运行中”但没有数据该如何处理? Agent安装完成后请等待10分钟,若仍然无数据,一般为conf文件中InstanceId配置错误。 请参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 父主题: 主机监控
Agent各种状态说明及异常状态处理方法 基础监控与操作系统监控数据出现不一致的问题 云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 未安装UVP VMTools对弹性云服务器监控指标有什么影响? 为什么云服务器看不到内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标?
部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件 请保证线下环境与云监控网络互通。 操作步骤 下载、安装并配置CES
无法配置RoCE网卡的IP、网关 重要 npu-smi不可用 请检查NPU驱动是否正常 无法正常使用NPU卡 重要 ascend-dmi不可用 请检查工具包ToolBox是否正常安装 无法使用ascend-dmi进行性能分析 NPU驱动异常告警 NpuDriverAbnormalWarning
无法配置RoCE网卡的IP、网关 重要 npu-smi不可用 请检查NPU驱动是否正常 无法正常使用NPU卡 重要 ascend-dmi不可用 请检查工具包ToolBox是否正常安装 无法使用ascend-dmi进行性能分析 NPU驱动异常告警 NpuDriverAbnormalWarning
Agent插件状态显示“故障”该如何处理? 操作系统监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 “故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。
Excel打开监控数据CSV文件乱码如何处理? 用户使用云监控服务可以将监控数据导出为csv文件,而使用Excel工具打开该文件时,可能出现中文乱码的情况。这是因为云监控服务导出的csv文件使用了UTF-8编码格式,而Excel是以ANSI格式打开的,没有做编码识别。针对此问题有以下解决方案:
复制状态异常已恢复 即复制时延已回到正常范围内,或者主备之间的网络通信恢复。 不需要处理。 实例运行状态异常已恢复 针对灾难性的故障,RDS有高可用工具会自动进行备机重建,重建完成之后即会上报本事件。 不需要处理。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表
添加数据转储到其他账号 数据转储可以实时将云服务监控数据转储到分布式消息服务Kafka中。当您需要通过分布式消息服务Kafka的控制台或使用开源Kafka客户端查询云服务的监控指标时,可以使用云监控服务提供的数据转储功能。 在CES上配置转储监控数据时,选择的“转储目标”资源类型支持转储到其他租户账号购买的kafka。
添加数据转储到当前账号 数据转储可以实时将云服务监控数据转储到分布式消息服务Kafka中。当您需要通过分布式消息服务Kafka的控制台或使用开源Kafka客户端查询云服务的监控指标时,可以使用云监控服务提供的数据转储功能。本章节指导如何将数据转储到当前账号。 一个账户最多创建20个数据转储任务。
挂载的ECS和ELB。 图8 子网排序 在拓扑图右上角搜索框内输入ID、name、ip地址,可以查找对应id、name、ip地址的节点。 工具栏功能操作方法: 开启拓扑图右上角3D视图开关,可以将平面视图切换为3D视图。 在拓扑图右上角缩放比例中设置数值,可以调整图的整体缩放比例,点击,快速切换缩放比例到100%。
站点监控 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。其提供简单的添加配置,不再浪费资源和精力配置复杂的开源产品。并且支持站点异常告警,不用担心网站出问题而无人知晓。 发布区域:以控制台实际上线区域为准 创建站点监控 创建站点监控的告警通知 事件监控