检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控页面增加监控插件状态筛选能力 您可以在主机监控页面筛选出不同状态监控插件的云服务器。 商用 - 2 告警通知内容优化 为了使您更容易地识别资源指标告警的影响和范围,云监控服务在指标的告警通知中,增加了告警资源名称,指标数据当前值。在云服务器的告警通知中,增加了云服务器的私网IP。
有哪些? 表1 适用场景 安装方式 适用场景 安装&升级插件 已支持一键安装的主机资源,可在界面直接点击“安装&升级插件”按钮,系统将自动识别可以进行一键安装的所有主机,进行批量安装插件。 远程安装 必须有可用的安装机,且安装机与需要安装插件的主机在同一VPC组内,确保安装机与待
Agent支持的指标列表 操作系统指标: CPU 指标 指标名称 指标说明 单位 支持版本 监控周期(原始指标) cpu_usage (Agent)CPU使用率 该指标用于统计测量对象当前CPU使用率。 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu使用率。用户可以通过top命令查看
服务资费 云监控服务基础功能免费,包括查看监控看板、创建告警规则、添加监控项等。同时云监控服务与其他云服务组合使用,为您提供监控数据文件转储、发送告警通知等增值服务,这些增值服务可能产生额外费用,具体由提供该功能的服务结算。 通常情况下,云监控服务产生的增值服务费用很低,因此建议您根据需要搭配使用。
Agent插件状态显示“运行中”但没有数据该如何处理? Agent安装完成后请等待10分钟,若仍然无数据,一般为conf文件中InstanceId配置错误。 请参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 父主题: 主机监控
如何获取Agent的Debug日志? 操作步骤 找到并且修改Agent日志配置文件,<ces>、<ces_new>如果都存在则都要修改,<ces>、<ces_new>如果只存在一个,可以只修改一个。 Linux: /usr/local/uniagent/extension/ins
创建/删除/复制/修改通知内容模板 通知内容模板是用户在配置告警通知时选择的一种通知内容格式。当通知方式选择通知组或主题订阅时,支持配置通知内容模板,通知内容模板可以选择系统模板、默认模板和自定义模板。 系统模板是是云监控服务系统自动提供的告警通知内容模版,用户无法进行修改 ,当
事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 DCS SYS.DCS 在线迁移发生全量重试 migrationFullResync 次要 在线迁移在重试时,因无法进行增量同步,而触发了全量同步。 确认是否发生反复的全量重试,需要检查到源端的网络连
进程监控 进程监控是针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。当您配置了自定义进程监控,还会监控包含关键字的进程个数。 插件会每分钟统计一次1分钟内消耗 CPU Top5的进程,Top5的进程不固定,进程列表中会展示出最近24小时内所有消耗CPU
创建站点监控 本章节指导用户创建站点监控,通过对站点进行网络探测,实现网络质量分析、性能分析等目的。 约束与限制 一个账户最多创建20个站点监控。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 在“站点监控”界面,单击右上角“创建站点监控”,进入“创建站点监控”界面。
手动配置Agent(可选) 操作场景 用户成功安装Agent插件后,推荐您采用“修复插件配置”方式配置Agent。如果“修复插件配置”不成功或其他原因导致无法配置Agent,你可以采用本章节提供的手工方式配置Agent。 约束与限制 目前支持Linux操作系统和Windows操作
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应
将监控数据导出到自建Prometheus/Grafana Prometheus是用于展示大型测量数据的开源可视化工具,在工业监控、气象监控、家居自动化和过程管理等领域也有着较广泛的用户基础。将华为云Cloudeye服务接入prometheus后,您可以利用 prometheus更好地监控和分析来自
查询指标列表 功能介绍 查询系统当前可监控指标列表,可以指定指标命名空间、指标名称、维度、排序方式,起始记录和最大记录条数过滤查询结果。 云服务资源删除后,会保留3个小时的数据缓存,在3小时之内还能查到资源对应的监控指标,属于正常现象。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
Agent插件状态显示“已停止”该如何处理? 查看Agent版本 使用root账号,登录ECS。 执行如下命令,确认使用Agent的版本。 if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope
配置数据存储 云监控服务各监控指标的原始数据的保留周期为两天,超过保留周期后原始数据将不再保存。您开通对象存储服务(Object Storage Service,以下简称OBS)后,可将原始数据同步保存至OBS,以保存更长时间。 本章节介绍如何配置数据存储。 当前支持“配置数据存
怎样让新购ECS实例中带有操作系统监控功能? 操作场景 本章节指导用户如何让新购买的ECS实例带有操作系统监控功能。 制作的私有镜像不可跨Region使用,因为跨Region使用私有镜像创建的ECS实例无法取得监控数据。 前提条件 已有安装Agent的ECS实例。 操作步骤 进入
Agent状态切换或监控面板有断点该如何处理? 问题现象 当云监控服务的Agent进程出现以下现象时,可能是因为Agent负载过高,状态不稳定导致: 管理控制台主机监控页面的“插件状态”参数在“运行中”和“故障”两个状态切换。 监控指标面板中存在断点。 约束与限制 当前章节的修复
Agent一键修复后无监控数据问题排查(老版本Agent) 问题现象 Agent一键修复后运行正常,但仍然没有监控数据。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时AK/SK失败