检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用主机监控 主机监控分为基础监控、操作系统监控、进程监控。 基础监控:ECS/BMS自动上报的监控指标。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的
IAM帐户权限异常该如何处理? 如果您需要使用主机监控功能,则用户组下子用户必须带有Security Administrator权限,若无Security Administrator权限会出现权限异常提示,请联系账号管理员修改权限。 云监控服务提供系统策略及操作与策略权限一览表,请参见:云监控服务系统策略。
在控制台界面安装/升级Agent 操作场景 本章节主要介绍如何在主机监控页面为弹性云服务器一键安装/升级Agent插件,为用户提供更加便捷的安装方式,请根据需要选择合适的安装方式。支持Agent一键安装的系统请参考Agent支持的系统有哪些? 表1 适用场景 安装方式 适用场景 安装&升级插件
主机监控 ECS是电商平台的基础支撑,因此ECS上细微的性能变化,都可能会引起电商业务的大幅震荡,甚至出现宕机,引起巨大损失。 主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为ECS自动上报的监控指标,操作系统监控通过在ECS中安装Agent插件,为
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
安装GPU指标集成插件 操作场景 通过在GPU加速型Linux实例上安装GPU监控插件,可以为用户提供系统级、主动式、细颗粒度的GPU监控,包含GPU指标收集和GPU系统事件上报。GPU支持监控的指标,参见GPU指标。 本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版GPU监控插件:
配额管理 什么是配额? 为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬盘。 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。
简介 电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工
创建我的看板 用户添加监控视图之前,需要先创建我的看板。目前云监控服务支持创建20个我的看板,满足您对云服务运行情况不同的监控需求。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“我的看板”,单击“创建看板”。 系统弹出“创建看板”窗口。 配置参数。 名称
使用事件监控 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控,并在事件发生时进行告警。 事件即云监控保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。
查看云服务监控指标 云监控服务基于云服务自身的服务属性,已经内置了详细全面的监控指标。当您在云平台上开通云服务后,系统会根据服务类型自动关联该服务的监控指标,帮助您实时掌握云服务的各项性能指标,精确掌握云服务的运行情况。 本章节指导用户如何查看云服务资源的监控数据,若发现有异常时可以及时处理。
查看站点监控数据 操作场景 本章节指导用户如何查看站点的监控数据,从可用性、响应时间、可用探测点等趋势来展示当前站点的访问情况。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“站点监控”。 进入“站点监控”界面。 系统展示用户当前所有站点概况。
Agent支持的指标列表 操作系统指标: CPU 指标 指标名称 指标说明 单位 支持版本 监控周期(原始指标) cpu_usage (Agent)CPU使用率 该指标用于统计测量对象当前CPU使用率。 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu使用率。用户可以通过top命令查看
事件监控支持的事件说明 表1 弹性云服务器 事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 ECS SYS.ECS 因系统故障触发重部署 startAutoRecovery 重要 弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常
入门实践 当您了解了云监控服务的功能后,可以根据自身的业务需求使用云监控服务搭建业务的系统级监控。 本文介绍云监控服务常用最佳实践,帮助您更好的使用云监控服务。 表1 常用最佳实践 实践 描述 电商平台 电商平台最佳实践 电商业务对内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。
Agent版本特性 CES Agent支持的镜像列表,参见 Agent支持的系统有哪些? CES Agent迭代版本已知版本特性如下: 2.7.2.1版本 基于2.7.2版本: 增加GPU指标。 增加NPU指标。 增加物理机硬件监控能力。详情说明参考BMS硬件监控插件说明。 2.7
Agent插件资源占用和熔断说明 资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保
查询事件监控列表 功能介绍 查询事件列表,包括系统事件和自定义事件。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /V1.0/{project_id}/events
Agent插件状态显示“故障”该如何处理? 操作系统监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 “故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。