检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
CES Agent如何通过授权获取临时AK/SK? 为了更加安全高效的使用云监控服务提供的主机监控功能,我们提供了最新方式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所
如何配置委托? 为了更加安全高效的使用云监控服务提供的主机监控功能,我们提供了最新方式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Age
已完成云监控主机监控Agent的安装,请参考Linux系统。 已完成插件修复。 已获取待安装插件的弹性云服务器的root密码。 使用一键安装脚本配置插件 华为云部分区域支持使用一键安装脚本来配置插件,目前支持一键安装脚本的区域如表2所示。 使用root账号,登录ECS。 执行如下命令,在“/usr/local/”目录下新建“user
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
构造请求 本节介绍REST API请求的组成,并以调用IAM服务的获取用户Token来说明如何调用API,该API获取用户的Token,Token可以用于调用其他API时鉴权。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com/videos/102987。
基础监控与操作系统监控数据出现不一致的问题 现象 基础监控显示CPU使用率90%以上,接近100%,操作系统内监控的CPU使用率不到50%,两者相差较大。 原因 如果您在操作系统(Guest OS)中配置idle=poll,当操作系统内部空闲时,进入polling状态消耗计算资源
请尝试重新安装Agent。 查看服务器内部时间和本地标准时间不一致。 使用的DNS非华为云DNS,请通过执行dig+目标域名获取到agent.ces.myhuaweicloud.com在华为云内网DNS下解析到的IP后再添加对应的hosts。 请将Agent更新为最新版本。 插件已恢复
请尝试重新安装Agent。 查看服务器内部时间和本地标准时间不一致。 使用的DNS非华为云DNS,请通过执行dig+目标域名获取到agent.ces.myhuaweicloud.com在华为云内网DNS下解析到的IP后再添加对应的hosts。 请将Agent更新为最新版本。 插件已恢复
查看主机监控的监控指标 本章节指导用户查看主机监控指标,监控指标分为Agent插件采集的细颗粒度的操作系统级别监控指标和ECS自带的监控指标。 操作系统监控指标和基础监控指标请参见云产品监控指标。 前提条件 已完成Agent插件的安装。安装请参考Agent安装说明进行安装。 操作步骤
升级Agent 当老架构的Agent不满足使用需求时,可以对Agent进行升级。云监控插件将不断升级版本,以便给您带来更好的监控体验。本章节主要介绍如何将老架构的Agent升级到新架构Agent。 约束限制 不支持局点:华南-广州-友好用户环境、拉美-圣保罗一、拉美-墨西哥城一。
添加数据转储到其他账号 数据转储可以实时将云服务监控数据转储到分布式消息服务Kafka中。当您需要通过分布式消息服务Kafka的控制台或使用开源Kafka客户端查询云服务的监控指标时,可以使用云监控服务提供的数据转储功能。 在CES上配置转储监控数据时,选择的“转储目标”资源类型
状态码 正常 返回值 说明 200 OK GET和PUT操作正常返回。 201 Created POST操作正常返回。 202 Accepted 请求已被接受。 204 No Content DELETE操作正常返回。 异常 返回值 说明 400 Bad Request 服务器未能处理请求。
Agent一键修复失败问题排查 问题现象 安装主机监控Agent后,单击“修复插件配置”后,插件状态仍然是“配置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /u
Agent状态切换或监控面板有断点该如何处理? 问题现象 当云监控服务的Agent进程出现以下现象时,可能是因为Agent负载过高,状态不稳定导致: 管理控制台主机监控页面的“插件状态”参数在“运行中”和“故障”两个状态切换。 监控指标面板中存在断点。 约束与限制 当前章节的修复
Agent安装说明 安装云监控插件后,可以为用户提供主机的系统级、主动式、细颗粒度的监控服务。本章节主要为您介绍在控制界面安装/升级、单台主机下安装、批量安装Agent的操作方法。 在控制台界面安装/升级Agent 云监控控制台支持为弹性云服务器一键安装/升级Agent插件,为用
查看监控视图 监控视图添加完成后,您可以在监控看板页面查看该监控项的监控走势图。系统提供固定时长和自定义时长两种方式查看近一个月的监控走势图,本节内容介绍如何查看更多时长的监控走势图。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“监控看板 > Dashboards”。
手动配置Agent(可选) 操作场景 用户成功安装Agent插件后,推荐您采用“修复插件配置”方式配置Agent。如果“修复插件配置”不成功或其他原因导致无法配置Agent,你可以采用本章节提供的手工方式配置Agent。 约束与限制 目前支持Linux操作系统和Windows操作
创建主机监控的告警通知 当您需要监控各云产品资源的使用情况时,可以创建告警规则并配置告警通知。如果资源的监控指标触发设定的阈值,云监控服务会在第一时间通过消息通知服务实时告知您云上资源异常,以免因此造成业务损失。本章节指导用户对ECS或BMS的监控指标创建告警规则。 操作步骤 登录管理控制台。
查询指标列表 功能介绍 查询系统当前可监控指标列表,可以指定指标命名空间、指标名称、维度、排序方式,起始记录和最大记录条数过滤查询结果。 云服务资源删除后,会保留3个小时的数据缓存,在3小时之内还能查到资源对应的监控指标,属于正常现象。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
Agent支持的指标列表 操作系统指标: CPU 指标 指标名称 指标说明 单位 支持版本 监控周期(原始指标) cpu_usage (Agent)CPU使用率 该指标用于统计测量对象当前CPU使用率。 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu使用率。用户可以通过top命令查看