检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常
基本概念 账号 用户注册时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用用户进行日常管理工作。 用户 由账号在IAM中创建的用户,是云服务的使用人员
使用资源分组 应用场景 业务视角管理资源 使用资源分组,方便用户将云账户下各类资源按业务分类,从业务角度出发查询监控与告警信息。 日常巡检与故障快速定位 资源分组提供资源概览、不健康资源列表、告警规则、告警记录等功能。方便用户查看云资源使用情况,收到报警后迅速定位故障资源与故障原因
Agent一键修复后无监控数据问题排查 问题现象 Agent一键修复后运行正常,但仍然没有监控数据。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /usr/local/uniagent
创建资源分组 使用场景 针对使用多种云产品的用户,通过资源分组功能将同一业务相关的弹性云服务器、裸金属服务器、云硬盘、弹性IP、带宽、数据库等资源添加到同一资源分组中。从分组角度查管理资源,管理告警规则,可以极大的降低运维复杂度,提高运维效率。 限制与约束 一个用户最多可创建1000
跨账号查看我的看板 应用场景 在云监控服务中,仅需登录一个账号就可以查看所在组织(Organization)下所有账号的看板。 目前只有“我的看板”提供跨账号功能,且只能查看,不能编辑。 该功能当前在华南-广州-友好用户环境、土耳其-伊斯坦布尔、西南-贵阳一、乌兰察布-汽车一、拉美
通过钉钉群接收告警通知 您在通知对象中选择“钉钉”通知渠道,并填写钉钉机器人的Webhook地址后,如果资源的监控指标达到告警条件,即可通过钉钉群接收告警通知。 前提条件 请确保您已创建通知对象并开启“企业微信”通知渠道白名单,开启白名单请参考申请开通SMN新协议公测。 创建钉钉机器人
进程监控 查看进程监控 进程监控是针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。当您配置了自定义进程监控,还会监控包含关键字的进程个数。 插件会每分钟统计一次1分钟内消耗 CPU Top5的进程,Top5的进程不固定,进程列表中会展示出最近
站点监控 大量的商品类目、用户信息、交易数量、店铺展示信息,会导致不同用户访问网站速度变慢。可使用站点监控对网站的可用性进行监控,并且对类目、用户、交易、店铺等接口进行持续拨测,测试接口的可用性,判断业务系统是否正常。 本章节以www.example.com为例,创建站点监控,并为站点的可用性
通过企业微信接收告警通知 您在通知对象中选择“企业微信”通知渠道,并填写企业微信机器人的Webhook地址后,如果资源的监控指标达到告警条件,即可通过企业微信群接收告警通知。 前提条件 请确保您已创建通知对象,并开启“企业微信”通知渠道白名单,开启白名单请参考申请开通SMN新协议公测
使用主机监控 主机监控分为基础监控、操作系统监控、进程监控。 基础监控:ECS/BMS自动上报的监控指标。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU
上报事件 功能介绍 事件监控为您提供上报自定义事件的接口,方便您将业务产生的异常事件或重要变更事件采集上报到云监控服务。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI
通过飞书群接收告警通知 您在通知对象中选择“飞书”通知渠道,并填写Webhook地址、秘钥或自定义关键词后,如果资源的监控指标达到告警条件,即可通过飞书群接收告警通知。 前提条件 请确保您已创建通知对象,并开启“企业微信”通知渠道白名单,开启白名单请参考申请开通SMN新协议公测。
配置云服务器全部挂载点磁盘使用率告警规则 场景描述 云监控服务提供了配置云服务器全部挂载点告警规则的能力。本章节介绍了配置云服务器全部挂载点磁盘使用率告警规则的操作流程。 磁盘使用率指标调整为挂载点维度,在新配置磁盘使用率告警规则时需要选择“云服务器挂载点”维度。 如果选择了配置云服务器全部挂载点的告警规则
安装GPU指标集成插件 操作场景 通过在GPU加速型Linux实例上安装GPU监控插件,可以为用户提供系统级、主动式、细颗粒度的GPU监控,包含GPU指标收集和GPU系统事件上报。GPU支持监控的指标,参见GPU指标。 本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版
配置数据存储 操作场景 云监控服务各监控指标的原始数据的保留周期为两天,超过保留周期后原始数据将不再保存。您开通对象存储服务(Object Storage Service,以下简称OBS)后,可将原始数据同步保存至OBS,以保存更长时间。 本章节介绍如何配置数据存储。 仅支持旧版操作
云服务监控及告警全流程介绍 用户购买了华为云资源后,并且该资源已经对接了CES云监控,那么该云服务的监控指标会自动上报给CES,用户可在CES进行资源监控指标数据的查看及配置告警,快速对云上资源进行全面、精准监控。 应用场景 资源购买后需要对资源的运行状态进行全面监控。 前提条件
策略和授权项说明 如果您需要对您所拥有的Cloud Eye进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用Cloud
Agent一键修复后无监控数据问题排查(老版本Agent) 问题现象 Agent一键修复后运行正常,但仍然没有监控数据。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时
Agent支持的指标列表 操作系统指标: CPU 指标 指标名称 指标说明 单位 支持版本 监控周期(原始指标) cpu_usage (Agent)CPU使用率 该指标用于统计测量对象当前CPU使用率。 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu