检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
站点的访问情况。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“站点监控”。 进入“站点监控”界面。 系统展示用户当前所有站点概况。包括站点名称、站点地址、探测类型、监控频率、可用探测点百分比、平均响应时间等。 单击站点名称所在行的“查看监控图表”。
使用主机监控 主机监控分为基础监控、操作系统监控、进程监控。 基础监控:ECS/BMS自动上报的监控指标。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的
监控数据管理 查询监控数据 添加监控数据 批量查询监控数据 查询主机配置数据 父主题: 云资源监控
查看云监控服务日志 操作场景 在您开启了云审计服务后,系统开始记录云监控资源的操作。云审计服务管理控制台保存最近7天的操作记录。 本节介绍如何在云审计服务管理控制台查看或导出最近7天的操作记录。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表”,选择“管理与监管
大幅震荡,甚至出现宕机,引起巨大损失。 主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为ECS自动上报的监控指标,操作系统监控通过在ECS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。 应用场景 促销、秒杀、爆款等电商业务
一键告警 一键告警为您提供针对服务下所有资源快速开启告警的能力,旨在帮助用户快速建立监控告警体系,在资源异常时可以及时获得通知。本章节介绍如何使用一键告警功能一键开启关键监控项告警的服务。 一键式告警和普通告警的主要差异点如表1所示。 表1 一键告警和告警对比一览表 告警类型 主要目标
事件监控最佳实践 常见问题 了解更多常见问题、案例和解决方案 热门案例 什么是聚合? 指标数据保留多少时间? 什么是云监控服务? Agent支持的系统有哪些? 业务端口被Agent占用该如何处理? 云监控服务支持的聚合方法有哪些? 为什么监控数据中会出现跳点的情况? 如何导出监控数据?
式,请根据需要选择合适的安装方式。支持Agent一键安装的系统请参考Agent支持的系统有哪些? 表1 适用场景 安装方式 适用场景 安装&升级插件 已支持一键安装的主机资源,可在界面直接点击“安装&升级插件”按钮,系统将自动识别可以进行一键安装的所有主机,进行批量安装插件。 远程安装
={period}&filter={filter} ces:metricData:list √ × 添加一条或多条自定义指标监控数据,解决系统监控指标不能满足具体业务需求的场景。 POST /V1.0/{project_id}/metric-data ces:metricData:create
将实时监控数据接入自建Prometheus 部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件 请保证线下环境与云监控网络互通。
登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“主机监控 > 弹性云服务器”。 单击需要查看资源详情的监控名称,进入“操作系统监控”界面。 单击右上角“查看资源详情”,弹出“查看资源详情”窗口。 可查看该监控的实例名称、实例ID、资源分组情况。 父主题: 主机监控
API版本号管理 查询API所有版本 查询API指定版本号 父主题: API版本号
修改告警规则 当用户业务发生变更或需要对已创建的告警规则进行重新规划时,可以对告警规则进行修改。本章节介绍如何修改告警规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警规则”,进入告警规则界面。 你可以选择以下两个路径进入告警规则修改页面:
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
对监控指标设置告警规则时,支持对多个云服务资源同时添加告警规则。告警规则创建完成后,可随时修改告警规则,支持对告警规则进行启用、停止、删除等灵活操作。 实时通知: 通过在告警规则中开启消息通知服务,当云服务的状态变化触发告警规则设置的阈值时,系统通过短信、邮件通知或发送消息至服务器地址等多种方式实时通知用
访问,部分监控可能出现异常数值 作业执行失败 jobRunningFailed 提示 作业执行失败 查看作业管理页面,确认失败任务是否有异常 作业执行过程出现失败 作业被终止 jobkilled 提示 作业被终止 确认任务是否人为下发终止命令 作业执行过程被终止 Oozie工作流执行失败
组”。 展开子账号所属的用户组的详情。 请参考创建用户组并授权为子账号所属的用户组添加相应权限。 云监控服务提供系统策略及操作与策略权限一览表,请参见:云监控服务系统策略。 父主题: 权限管理
Agent支持的镜像列表,参见 Agent支持的系统有哪些? CES Agent迭代版本已知版本特性如下: 2.7.5.1版本 基于2.7.5版本: GPU指标采集加固。 2.7.5版本 修复TCP连接数过多时cpu冲高bug,默认ss-s轻量采集TCP指标。 修复系统进程数指标和文件句柄总数指标值不刷新bug。
云监控服务相关概念 使用云监控服务之前,请先了解以下相关概念,从而可以更好的使用云监控服务。 监控指标 聚合 监控面板 主题 告警规则 告警模板 项目 企业项目 监控指标 监控指标是云监控服务的核心概念,通常是指云平台上某个资源的某个维度状态的量化值,如云服务器的CPU使用率、内
当老架构的Agent不满足使用需求时,可以对Agent进行升级。云监控插件将不断升级版本,以便给您带来更好的监控体验。本章节主要介绍如何在Windows操作系统上将老架构的Agent升级到新架构Agent。 约束限制 不支持局点:华南-广州-友好用户环境、拉美-圣保罗一、拉美-墨西哥城一。 操作步骤