检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控Agent占用的系统资源很小,性能基本不会受到影响。 在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装Agent资源占用情况如下: CPU单核使用率最
云监控服务”。 单击“主机监控 > 弹性云服务器”,进入主机监控页面。 单击“安装&升级插件”,在右侧弹出安装&升级插件指引。 根据指引安装&升级插件。 图1 安装&升级插件 远程安装 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“主机监控 > 弹性云服务器”,进入主机监控页面。
主机监控分为基础监控、操作系统监控和进程监控。无论您使用的是弹性云服务器还是裸金属服务器,都可以使用主机监控来采集丰富的操作系统层面监控指标,也可以使用主机监控进行服务器资源使用情况监控和排查故障时的监控数据查询。 基础监控:ECS自动上报的监控指标,数据采集频率为5分钟1次。可以监控
1版本后集成了物理机硬件监控插件,通过实时巡检发现硬件的亚健康状态,提前规避故障风险,为BMS实例提供全面硬件故障监控能力。 物理机硬件监控插件只针对BMS实例生效,其他云服务器不受其影响。 BMS实例缺失硬件监控插件会导致华为云无法第一时间感知实例的硬件故障,可能影响业务可用性时长,且故障需要用户主动联系技术支持处理。
支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法如下 登录弹性云服务器。 更新镜像源,获取安装依赖。 wget http://mirrors
Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 账号欠费。 Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 服务器内部时间和本地标准时间不一致。 Agent插件版本不同,日志路径也不同。
概述 欢迎使用云监控服务(Cloud Eye)。云监控为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。 您可以使用本文档提供的API对指标、告警规则、监控数据进行相关操作,如
看被监控资源的详细信息。 单击页面右上角的“设置监控指标”。 进入“设置监控指标”页面。 您可以选择要展示的指标名称,并且可以拖动选中指标对指标进行排序,方便您自定义需要查看的指标运行状况。 人工智能服务、API网关暂不支持自定义设置指标自定义显示。 鼠标滑动到对应指标后,单击指标视图右上角的图标。
测量对象:云服务器或裸金属服务器 通过计算/proc/pid/stat的变化得出。 测量对象:云服务器或裸金属服务器 通过Windows API GetProcessTimes获取进程CPU使用率。 内存使用率 进程消耗的内存百分比。 0-1 测量对象:云服务器或裸金属服务器 计算方
值却触发了告警? 问题现象 告警规则配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到告警阈值却触发了告警。 问题分析 弹性云服务器实例下有A、B两个磁盘,当磁盘A的读指标和磁盘B的写指标同时达到阈值时就告警了,并不是磁盘A的读写指标同时达到阈值时才告警。 云产品的
准确掌握主机资源的云上运行状态。 前提条件 账号下已购买了ECS弹性云服务器资源,同时在CES主机监控列表能看到资源信息。 为主机配置安装Agent插件 ECS会上报基础监控指标和操作系统监控指标,其中基础监控指标是ECS云服务本身上报的指标,但是这类指标的采集周期大部分是5分钟周期,另一种则是操作系统安装了CES
创建自定义告警模板选择的资源类型,即服务命名空间,如选择弹性云服务器,则命名空间为SYS.ECS。 须知: 当选择的资源类型为“弹性云服务器中操作系统监控”,命名空间必须为SYS.ECS。 dimension_name 是 String 资源类型对应的指标监控维度,选择弹性云服务器,则维度为云服务器,dimensio
明。 服务器内部时间和本地标准时间不一致。 使用的DNS非华为云DNS,请通过执行dig+目标域名获取到agent.ces.myhuaweicloud.com在华为云内网DNS下解析到的IP后再添加对应的hosts。华为云提供的内网DNS地址请参见华为云提供的内网DNS地址是多少?。
配置指标告警 您可以对主机监控、云服务监控中的指标项设置告警规则。您可以在不同的监控对象层级(全部资源、资源分组、指定实例维度)设置告警规则。 前提条件 请确保您已拥有云监控服务的操作权限,能够创建告警规则。 资源层级 配置告警时,您需要指定监控对象的资源层级,资源层级分为云产品
HTTP方法 方法 说明 GET 请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源,如删除对象等。 HEAD 请求服务器资源头部。 PATCH 请求服务器更新资源的部分内容。 当资源不存在的
机资源列表。 查看ECS操作系统监控指标的方法:单击左侧导航栏的“主机监控 > 弹性云服务器”,再单击ECS实例所在行的“查看监控指标”,如图1所示。 图1 操作系统监控 查看ECS基础监控指标的方法:单击左侧导航栏的“主机监控 > 弹性云服务器”,再单击ECS实例所在行的“查看
告警策略 用户可以对服务的监控指标和事件设置告警策略。当监控指标在一定周期内多次触发告警策略的阈值时,系统将向用户发送告警通知。下面将展示如何配置指标类和事件类的告警策略。 配置指标类告警策略 用户可以针对云服务的核心监控指标设置指标告警,在发生异常时及时通知您采取措施。指标类告
String 创建自定义告警模板选择的资源类型,即服务命名空间,如选择弹性云服务器,则命名空间为SYS.ECS。 dimension_name 是 String 资源类型对应的指标监控维度,选择弹性云服务器,则维度为云服务器,dimension_name值为instance_id。 template_items
当任务类型选择TCP或UDP时,可设置请求内容。 - 可用条件 当任务类型选择HTTP时,可用条件可设置为响应时间(ms)、状态码、Body。 当任务类型选择TCP或UDP时,可用条件可设置为响应时间(ms)、响应内容(十六进制)、响应内容(文本)。 当任务类型选择PING时,可用条件可设置为响应时间(ms)、丢包率(%)。
多种通知方式 通过在告警规则中开启消息通知,当云服务的状态变化触发告警规则设置的阈值时,系统提供电话、短信、邮箱、企业微信、钉钉、飞书和Welink通知,还可以通过HTTP、HTTPS将告警信息发送至告警服务器,用户可以在第一时间知悉业务运行状况,便于构建智能化的程序处理告警。 批量创建告警规则