检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
所有指标的监控数据,以Json格式存储。 为了方便用户使用,云监控服务为用户提供了格式转换以及内容拼接工具。使用该工具,用户可以把某一个特定资源下的若干个时间片的文件按照时间序列合并为一个按时间拼接的文件,文件格式为csv。同时可以对资源下的每个指标生成独立的时间拼接文件,文件格式为csv。
s、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法如下 登录弹性云服务器。 更新镜像源,获取安装依赖。 wget http://mirrors
云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 因为云监控服务与弹性云服务器系统内指标检测软件的采样周期不同。 云监控服务对弹性云服务器、云硬盘的采样周期是4分钟(云服务器类型为KVM的是5分钟),而系统内工具的采样周期一般为1秒,远远小于云监控服务的采样周期。
入门实践 当您了解了云监控服务的功能后,可以根据自身的业务需求使用云监控服务搭建业务的系统级监控。 本文介绍云监控服务常用最佳实践,帮助您更好的使用云监控服务。 表1 常用最佳实践 实践 描述 电商平台 电商平台最佳实践 电商业务对内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。
关系型数据库事件 关系型数据库是一种基于云计算平台的即开即用、稳定可靠、弹性伸缩、便捷管理的在线关系型数据库服务。在使用关系型数据库中,需持续关注数据库状态,可通过事件监控,对异常事件告警进行处理,保证业务稳定运行。 表1 RDS重点事件 事件名称 事件说明 处理步骤 创建实例业务失败
安装配置CES Exporter Prometheus是用于展示大型测量数据的开源可视化工具,在工业监控、气象监控、家居自动化和过程管理等领域也有着较广泛的用户基础。将华为云Cloud Eye服务接入Prometheus后,您可以利用Prometheus更好地监控和分析来自Cloud
将监控数据导出到自建Prometheus/Grafana Prometheus是用于展示大型测量数据的开源可视化工具,在工业监控、气象监控、家居自动化和过程管理等领域也有着较广泛的用户基础。将华为云Cloudeye服务接入prometheus后,您可以利用 prometheus更好地监控和分析来自
Excel打开监控数据CSV文件乱码如何处理? 用户使用云监控服务可以将监控数据导出为csv文件,而使用Excel工具打开该文件时,可能出现中文乱码的情况。这是因为云监控服务导出的csv文件使用了UTF-8编码格式,而Excel是以ANSI格式打开的,没有做编码识别。针对此问题有以下解决方案:
ClickHouse集群的监控指标说明 人工智能 ModelArts SYS.ModelArts Key:service_id Value:在线服务ID Key:model_id Value:模型负载ID ModelArts的监控指标说明 图像搜索服务 SYS.IS Key:instanceName
部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件 请保证线下环境与云监控网络互通。 操作步骤 下载、安装并配置CES
GPU驱动正常安装后,最多10分钟将在控制台看到采集到的GPU指标数据。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法,请参见安装lspci工具。 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
Agent各种状态说明及异常状态处理方法 基础监控与操作系统监控数据出现不一致的问题 云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 未安装UVP VMTools对弹性云服务器监控指标有什么影响? 为什么云服务器看不到内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标?
性,才可以正常使用,支持细粒度授权的云服务列表请参考: 使用IAM授权的云服务。 表2列出了云监控服务常用操作与系统权限的授权关系,您可以参照该表选择合适的系统权限。 表2 常用操作与系统权限的关系 功能 操作 CES FullAccessPolicy CES ReadOnlyAccessPolicy
事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 DCS SYS.DCS 在线迁移发生全量重试 migrationFullResync 次要 在线迁移在重试时,因无法进行增量同步,而触发了全量同步。 确认是否发生反复的全量重试,需要检查到源端的网络连
SDK概述 本文介绍了CES服务提供的SDK语言版本,列举了最新版本SDK的获取地址。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 SDK列表 在开始使用之前,请确保您安装的是最新版本的SDK。使用过时的版本可
支持监控的服务列表 服务优势 03 使用 为您全面展示华为云云监控服务的监控面板、主机监控Agent、告警规则和告警通知等功能的详细使用方法和步骤。 常用操作 监控面板简介 主机监控简介 站点监控简介 事件监控简介 05 APIs 通过云监控服务开放的丰富API和调用示例,您可以使用并管理监控指标和告警规则、查询监控数据等。
JSON视图创建自定义策略:可以在选择策略模板后,根据具体需求编辑策略内容;也可以直接在编辑框内编写JSON格式的策略内容。 具体创建步骤请参见:创建自定义策略。本章为您介绍常用的云监控服务自定义策略样例。 云监控服务自定义策略样例 示例1:授权用户拥有云监控服务修改告警规则的权限。 { "Version":
事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 DCS SYS.DCS 在线迁移发生全量重试 migrationFullResync 次要 在线迁移在重试时,因无法进行增量同步,而触发了全量同步。 确认是否发生反复的全量重试,需要检查到源端的网络连
ClickHouse集群的监控指标说明 人工智能 ModelArts SYS.ModelArts Key:service_id Value:在线服务ID Key:model_id Value:模型负载ID ModelArts的监控指标说明 图像搜索服务 SYS.IS Key:instanceName