Agent不同插件状态说明及处理方式 Agent有以下五种状态: 未安装/未启动:指未在该ECS/BMS中安装Agent或手动停止了Agent。 运行中:Agent运行正常,可正常上报监控数据。 故障:监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。
查看广域网质量监控 创建广域网质量监控任务后,可以查看任务详情、监控分析、设置阈值,便于及时获取异常数据,并处理故障。本章节指导用户如何查看广域网质量监控任务。 前提条件 已创建广域网质量监控。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“网络性能监控 >
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CT
创建监控大盘 当您需要观测云服务的整体资源监控使用情况时,可以根据需要选择监控大盘模板创建监控大盘,可视化观测云上资源的各类核心重点指标数据。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“我的看板 > 监控大盘”。 在“监控大盘”界面,单击右上
查询指标列表 功能介绍 查询系统当前可监控指标列表,可以指定指标命名空间、指标名称、维度、排序方式,起始记录和最大记录条数过滤查询结果。 云服务资源删除后,会保留3个小时的数据缓存,在3小时之内还能查到资源对应的监控指标,属于正常现象。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
手动恢复告警记录 手动恢复是指用户在控制台上通过人工干预来确认问题已经被解决,并将该告警状态改为“已解决(手动)”。此操作存在风险,只用于特殊场景,一般不建议做手动恢复。本章节指导用户如何手动恢复告警记录。 约束与限制 告警状态为告警中、已触发或数据不足时,可手动恢复告警记录。 操作步骤
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工
云服务监控及告警全流程介绍 用户购买了华为云资源后,并且该资源已经对接了CES云监控,那么该云服务的监控指标会自动上报给CES,用户可在CES进行资源监控指标数据的查看及配置告警,快速对云上资源进行全面、精准监控。 应用场景 资源购买后需要对资源的运行状态进行全面监控。 前提条件
应用场景 云监控服务为用户提供了非常丰富的使用场景。 云服务监控 用户开通了云监控服务支持的云服务后,即可方便地在云监控Console页面查看您的云产品运行状态和相关指标数据,并对监控项创建告警规则。 主机监控 通过监控ECS或BMS的CPU使用率、内存使用率、磁盘等基础指标,确
事件监控简介 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。事件监控不依赖于Agent插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统
概述 欢迎使用云监控服务(Cloud Eye)。云监控为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。 您可以使用本文档提供的API对指标、告警规则、监控数据进行相关操作,如
如何配置DNS和安全组? 本章节指导用户为Linux系统的主机添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,其他主机步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置。
站点监控 针对大量的静态数据,如产品图片,产品视频等导致不同网络用户访问电商网站出现网页打开慢、网络延时高等问题。可以使用站点监控对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“站点监控”。
监控大盘简介 监控大盘是根据一些重点云服务的资源水位使用情况、核心业务指标的推荐,内置的默认监控看板。用户仅需简单的开启大盘即可创建完成重点服务的看板视图,方便可视化观测云上资源的各类核心重点指标数据。 监控大盘适用于对重点云服务资源有整体资源监控使用情况观测的场景。若您想要快速
使用自定义看板创建个性化的视图 应用场景 自定义看板作为云服务看板的补充,允许您可以通过自定义的方式创建可视化看板,您可以自主选择指标、图表类型来展现您关注的资源图表。本章以查看多台ECS实例下带外网络流出速率的监控数据变化趋势为例,为您介绍我的看板的具体操作流程。更多操作指导请参考监控看板。
快速构建主机监控能力 应用场景 主机资源作为最重要的云上资源,如何做好对它的监控、告警,在实际的运维过程中尤为重要。可以借助云监控快速构建主机监控能力,通过在华为云公共镜像主机(ECS实例)中安装Agent插件,在主机监控以可视化的方式查看其监控数据,以及对重点业务指标进行配置监
云监控服务相关概念 使用云监控服务之前,请先了解以下相关概念,从而可以更好的使用云监控服务。 监控指标 聚合 监控面板 主题 告警规则 告警模板 项目 企业项目 监控指标 监控指标是云监控服务的核心概念,通常是指云平台上某个资源的某个维度状态的量化值,如云服务器的CPU使用率、内
创建资源分组 针对使用多种云产品的用户,通过资源分组功能将同一业务相关的弹性云服务器、裸金属服务器、云硬盘、弹性IP、带宽、数据库等资源添加到同一资源分组中。从分组角度查管理资源,管理告警规则,可以极大的降低运维复杂度,提高运维效率。 约束与限制 一个用户最多可创建1000个资源分组。
云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 因为云监控服务与弹性云服务器系统内指标检测软件的采样周期不同。 云监控服务对弹性云服务器、云硬盘的采样周期是4分钟(云服务器类型为KVM的是5分钟),而系统内工具的采样周期一般为1秒,远远小于云监控服务的采样周期。
管理广域网质量监控告警规则 当业务变化或者当之前配置的广域网质量监控的告警规则不符合您的业务需求时,您可参考本章节导出告警记录,或修改、停用、启用、删除、复制、屏蔽、取消屏蔽广域网质量监控的告警规则。 前提条件 已创建广域网质量监控告警规则。 告警记录导出 登录管理控制台。 单击“服务列表
您即将访问非华为云网站,请注意账号财产安全