检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Prometheus是用于展示大型测量数据的开源可视化工具,在工业监控、气象监控、家居自动化和过程管理等领域也有着较广泛的用户基础。将华为云Cloudeye服务接入prometheus后,您可以利用 prometheus更好地监控和分析来自 Cloudeye服务的数据。 Grafana是一个开源的可视化和分析
安装配置CES Exporter Prometheus是用于展示大型测量数据的开源可视化工具,在工业监控、气象监控、家居自动化和过程管理等领域也有着较广泛的用户基础。将华为云Cloud Eye服务接入Prometheus后,您可以利用Prometheus更好地监控和分析来自Cloud
s、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法如下 登录弹性云服务器。 更新镜像源,获取安装依赖。 wget http://mirrors
Agent安装完成后请等待10分钟,若仍然无数据,一般为conf文件中InstanceId配置错误。 请参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 父主题: 主机监控
云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 因为云监控服务与弹性云服务器系统内指标检测软件的采样周期不同。 云监控服务对弹性云服务器、云硬盘的采样周期是4分钟(云服务器类型为KVM的是5分钟),而系统内工具的采样周期一般为1秒,远远小于云监控服务的采样周期。
“故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 账号欠费。 Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 服务器内部时间和本地标准时间不一致。
创建告警规则 应用场景 告警功能为您提供监控数据的告警服务。您可以通过创建告警规则来定义告警系统如何检查监控数据,并在监控数据满足告警策略时发送报警通知。 对重要监控指标创建告警规则后,便可在第一时间得知指标数据发生异常,迅速处理故障。 功能介绍 支持对云监控服务的所有监控项创建告警规则。
RDS重点事件 事件名称 事件说明 处理步骤 创建实例业务失败 创建实例失败产生的事件,一般是磁盘个数,配额大小都很小,底层资源耗尽导致。 检查磁盘个数、配额大小,释放资源后重新创建。 实例全量备份失败 单次全量备份失败产生的事件,不影响以前成功备份的文件,但会对“时间点恢复”的功
进入云监控服务提示权限不足该如何处理? 此问题与权限配置有关,一般为IAM子账号权限不足,需检查IAM配置的权限。 管理员使用主账户登录管理控制台。 在控制台页面,鼠标移动至右上方的用户名,在下拉列表中选择“统一身份认证”。 在统一身份认证服务,左侧导航窗格中,单击“用户组”。 展开子账号所属的用户组的详情。
中包含该时间分片下某一个资源下所有指标的监控数据,以Json格式存储。 为了方便用户使用,云监控服务为用户提供了格式转换以及内容拼接工具。使用该工具,用户可以把某一个特定资源下的若干个时间片的文件按照时间序列合并为一个按时间拼接的文件,文件格式为csv。同时可以对资源下的每个指标
添加数据转储 操作场景 数据转储可以实时将云服务监控数据转储到分布式消息服务Kafka中。当您需要通过分布式消息服务Kafka的控制台或使用开源Kafka客户端查询云服务的监控指标时,可以使用云监控服务提供的数据转储功能。 一个账户最多创建20个数据转储任务。 添加“数据转储”功能按照客户白名单开放。
返回版本号,表示使用新版本Agent。 返回“0”,表示未安装Agent。 问题分析 一键式修复插件失败后的排查思路: 检查DNS配置。 检查IAM委托配额。 查看用户权限。 解决方法 检查DNS配置是否正确。 登录管理控制台。 单击“计算 > 弹性云服务器”。 单击弹性云服务器名称。 进入弹性云服务器详情页面。
请求无效 The request is invalid. 检查请求信息 400 ces.0013 无效的URL参数或参数不存在 The URL parameter is invalid or does not exist. 检查URL参数 400 ces.0014 请求体错误 Some
Excel打开监控数据CSV文件乱码如何处理? 用户使用云监控服务可以将监控数据导出为csv文件,而使用Excel工具打开该文件时,可能出现中文乱码的情况。这是因为云监控服务导出的csv文件使用了UTF-8编码格式,而Excel是以ANSI格式打开的,没有做编码识别。针对此问题有以下解决方案:
部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件 请保证线下环境与云监控网络互通。 操作步骤 下载、安装并配置CES
终端节点健康状态异常 healthCheckError 重要 通过健康检查探测终端节点状态异常。 根据终端节点的健康检查结果异常如何排查?文档排查原因,未解决则提交工单。 当健康检查探测到您的终端节点异常时,不再向异常的终端节点转发流量,直到健康检查检测到终端节点恢复正常时,才会继续转发流量。 表35
终端节点健康状态异常 healthCheckError 重要 通过健康检查探测终端节点状态异常。 根据终端节点的健康检查结果异常如何排查?文档排查原因,未解决则提交工单。 当健康检查探测到您的终端节点异常时,不再向异常的终端节点转发流量,直到健康检查检测到终端节点恢复正常时,才会继续转发流量。 表35
据库或弹性公网IP和带宽。 告警规则参数详情,请参见创建告警规则。 为了更好监控弹性负载均衡服务,需要先开启负载均衡ELB的健康检查,详情参见健康检查异常如何排查?,建议设置负载均衡ELB网络流出速率的80%作为告警阈值。 建议将RDS的CPU使用率告警阈值设置为80%,连续三次
GPU驱动正常安装后,最多10分钟将在控制台看到采集到的GPU指标数据。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法,请参见安装lspci工具。 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
返回版本号,表示使用新版本Agent。 返回“0”,表示未安装Agent。 问题解决(Linux) 以root用户登录弹性云服务器或裸金属服务器。 执行如下命令,检查telescope进程是否存在: ps -ef |grep telescope 当显示如下内容时,表示telescope进程正常。 图1 查看telescope进程