检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建我的看板 用户添加监控视图之前,需要先创建我的看板。目前云监控服务支持创建20个我的看板,满足您对云服务运行情况不同的监控需求。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“我的看板”,单击“创建看板”。 系统弹出“创建看板”窗口。 配置参数。 名称
Agent版本特性 CES Agent支持的镜像列表,参见 Agent支持的系统有哪些? CES Agent迭代版本已知版本特性如下: 2.7.2.1版本 基于2.7.2版本: 增加GPU指标。 增加NPU指标。 增加物理机硬件监控能力。详情说明参考BMS硬件监控插件说明。 2.7
助您安全的控制华为云资源的访问。 鉴权 您可以通过以下方式登录华为云,如图1所示。 华为云账号:您首次使用华为云时创建的账号,该账号是您的华为云资源归属、资源使用计费的主体,对其所拥有的资源及云服务具有完全的访问权限。 IAM用户:由管理员在IAM中创建的用户,是云服务的使用人员,根据账号授予的权限使用资源。
namespace 否 String 查询服务的命名空间,各服务命名空间请参考支持监控的服务列表。 格式为service.item;service和item必须是字符串,必须以字母开头,只能包含0-9/a-z/A-Z/_,service.item总长度最短为3,最大为32。 metric_name
当出现以下情况时,有可能在云监控服务中看不到监控数据: 购买云服务资源后,首先确认该服务是否已对接云监控服务,请参考支持监控的服务列表。 已对接云监控的服务,由于各个服务采集上报监控数据的频率各有不同,请耐心等待一段时间。 弹性云服务器或裸金属服务器关机超过1小时以上。 云硬盘没有挂载给弹性云服务器或裸金属服务器。
云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 因为云监控服务与弹性云服务器系统内指标检测软件的采样周期不同。 云监控服务对弹性云服务器、云硬盘的采样周期是4分钟(云服务器类型为KVM的是5分钟),而系统内工具的采样周期一般为1秒,远远小于云监控服务的采样周期。
云监控服务”。 单击页面左侧导航栏的“云服务监控”,进入“云服务监控”页面,单击待配置的云服务名称,单击右上角“返回旧版”。 选择待查看的云服务资源所在行的“配置数据存储”,进入“配置数据存储”页面。 或单击页面左侧的“主机监控”,选择待查看的ECS资源所在行的“操作 > 配置数据存储”,进入“配置数据存储”页面。
连接各业务与数据库的各个基础接口。BMS与ECS的运行状态对整体业务至关重要,CPU、内存、磁盘使用率等会直接影响整体业务状态,因此,需使用主机监控和事件监控随时监控ECS与BMS的运行状况。 网站与各个基础接口的可用性、响应时间、丢包率等会直接影响用户使用的流畅程度,需使用站点监控随时监控各站点的运行情况。
查看主机监控的监控指标 操作场景 本章节指导用户查看主机监控指标,监控指标分为Agent插件采集的细颗粒度的操作系统级别监控指标和ECS自带的监控指标。 操作系统监控指标和基础监控指标请参见云产品监控指标。 前提条件 已完成Agent插件的安装。安装请参考安装配置Agent进行安装。
event_source 是 String 事件来源。 格式为service.item,根据实际情况自定义配置。 service和item必须是字符串,必须以字母开头,只能包含0-9/a-z/A-Z/_,service.item总长度最短为3,最大为32。 time 是 Long
事件监控 在实际的业务的运行中,ECS、BMS可随时根据业务调整,进行删除、重启、关闭、删除网卡、删除安全组等操作。因此,可以使用事件监控随时监控ECS、BMS的运行状态。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工
如何获取Agent的Debug日志? 操作步骤 找到并且修改Agent日志配置文件,<ces>、<ces_new>如果都存在则都要修改,<ces>、<ces_new>如果只存在一个,可以只修改一个。 Linux: /usr/local/uniagent/extension/ins
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
域开放。 前提条件 当前账号所在的组织需开通可信服务功能。详细请参见启用、禁用可信服务。 使用跨账号功能需要拥有组织的管理员或CES服务的委托管理员身份。如何创建委托管理员请参见添加、查看和取消委托管理员。 操作步骤 以组织的管理员或CES服务的委托管理员身份登录管理控制台。 单击“服务列表
net_tcp_sys_recv (Agent) TCP SYS_RECV状态的连接数量。 该指标用于统计测量对象服务器端收到的请求连接的TCP数量。 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI
主机监控配置监控及告警的全流程介绍 主机资源作为最重要的云上资源,如何做好对它的监控、告警,在实际的运维过程中尤为重要,本文主要介绍主机如何进行监控及配置告警。 应用场景 当用户购买了主机资源后,对于资源的运行状态需要进行必要的监控,以及对重点业务指标进行配置监控告警,能及时准确掌握主机资源的云上运行状态。
云监控在视频直播中的应用 简介 主机监控 ELB监控 网络监控 父主题: 场景化实践案例
namespace 否 资源命名空间,例如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 dname 否 资源维度,例如弹性云服务器维度为:instance_id,各资源的维度可查看支持监控的服务列表。 start 否 分页起始值,类型为integer,默认值为0。
日志监控提供了针对日志内容的实时监控能力。通过云监控服务和云日志服务的结合,用户可以针对日志内容进行监控统计、设置告警规则等,降低用户监控日志的运维成本,简化用户使用监控日志的流程。 事件监控 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。