检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装GPU指标集成插件 通过在GPU加速型Linux实例上安装GPU监控插件,可以为用户提供系统级、主动式、细颗粒度的GPU监控,包含GPU指标收集和GPU系统事件上报。GPU支持监控的指标,参见GPU指标。 本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版
批量安装Agent 本章节主要介绍如何批量安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 批量安装不支持跨区域执行。 批量安装的主机需同属一个VPC。 Windows版本暂不支持批量安装Agent。 前提条件 已配置DNS和安全组,配置方法参考如何配置
all_instances: 全部资源, specific_instances: 指定资源 枚举值: all_instances specific_instances values 否 Array of strings 维度值列表 最小长度:1 最大长度:1024 数组长度:0
all_instances: 全部资源, specific_instances: 指定资源 枚举值: all_instances specific_instances values Array of strings 维度值列表 最小长度:1 最大长度:1024 数组长度:0 -
表1 适用场景 安装方式 适用场景 安装&升级插件 已支持一键安装的主机资源,可在界面直接点击“安装&升级插件”按钮,系统将自动识别可以进行一键安装的所有主机,进行批量安装插件。
修改DNS与添加安全组(Windows) 本章节指导用户为Windows系统的ECS主机添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。 修改ECS的DNS配置有两种方式:Windows图形化界面和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置
修改DNS与添加安全组(Linux) 本章节指导用户为Linux系统的ECS或BMS添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,BMS操作步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台
企业项目的子用户在监控概览页面可以查看到主账号资源信息 云监控服务的概览页面暂未支持按企业项目分权分域维度的查询功能,敬请期待。 父主题: 云服务监控
单台主机下安装Agent 本章节主要介绍如何在单台主机中手动安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 目前只支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已配置DNS和安全组,配置方法参考如何配置
方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控,并在事件发生时进行告警。 事件即云监控保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。
方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。事件监控不依赖于Agent插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。
总览 总览由资源监控和站点监控两部分组成。通过查看总览,让用户实时了解各云服务的资源告警情况和站点响应情况。 资源监控 资源监控是以资源分组维度横向展示和各个服务资源维度纵向分布,将各个资源的实时告警情况进行展示,用户可按照不同维度对资源告警进行关注,方便高效管理您的资源。
SYS.CBH Key:server_id Value:CBH实例ID 云堡垒机的监控指标说明 企业应用 应用与数据集成平台 ROMA Connect SYS.ROMA Key:kafka_groups Value:消费组 Key:kafka_groups_topics Value
SYS.CBH Key:server_id Value:CBH实例ID 云堡垒机的监控指标说明 企业主机安全 SYS.HSS Key:host_id Value:主机实例 企业主机安全的监控指标说明 企业应用 应用与数据集成平台 ROMA Connect SYS.ROMA Key
告警中:监控指标数值达到告警配置阈值,资源正在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致; 已触发:监控的资源触发了告警策略中配置的事件; 已失效:告警规则中监控的资源或告警策略有调整
请工单联系运维后台协调资源,删除添加失败的节点,重新尝试添加节点 节点扩容失败 节点缩容失败 reduceNodeFailed 重要 一般是由于底层释放资源失败等原因导致。 请工单联系运维后台处理资源。
为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬盘。 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。
资源总览 资源总览展示您当前账户下弹性云服务器,关系型数据库、弹性公网IP和带宽、云硬盘、对象存储服务等云服务资源总数以及告警数,方便您快速了解云服务资源的运行情况。 告警统计 告警统计提供最近7日告警趋势图、当前不同等级告警条数统计。
监控大盘简介 监控大盘是根据一些重点云服务的资源水位使用情况、核心业务指标的推荐,内置的默认监控看板。用户仅需简单的开启大盘即可创建完成重点服务的看板视图,方便可视化观测云上资源的各类核心重点指标数据。 监控大盘适用于对重点云服务资源有整体资源监控使用情况观测的场景。
重要告警:告警规则对应资源存在影响业务的问题,此问题相对较严重,有可能会阻碍资源的正常使用。 次要告警:告警规则对应资源存在相对不太严重点问题,此问题不会阻碍资源的正常使用。 提示告警:告警规则对应资源存在潜在的错误可能影响到业务。 父主题: 告警