检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控配置监控及告警的全流程介绍 主机资源作为最重要的云上资源,如何做好对它的监控、告警,在实际的运维过程中尤为重要,本文主要介绍主机如何进行监控及配置告警。 应用场景 当用户购买了主机资源后,对于资源的运行状态需要进行必要的监控,以及对重点业务指标进行配置监控告警,能及时准确掌握主机资源的云上运行状态。
最大值:2147483647 表5 Dimension 参数 参数类型 描述 name String 资源维度,如:弹性云服务器,则维度为instance_id;目前最大支持4个维度,各服务资源的指标维度名称可查看:“服务维度名称”。 正则匹配:^([a-z]|[A-Z]){1}([a-z]|[A-Z]|[0-9]|_|-){1
Integer 否 选择查询的时间范围内,此事件发生的数量。 latest_occur_time Long 否 此事件最近一次发生的时间。 latest_event_source String 否 事件来源,如果是系统事件则值为各服务的命名空间,可查看支持监控的服务列表。 如果是自定义事件
Request 服务器未能处理请求。 401 Unauthorized 被请求的页面需要用户名和密码。 403 Forbidden 对被请求页面的访问被禁止。 404 Not Found 服务器无法找到被请求的页面。 405 Method Not Allowed 请求中指定的方法不被允许。
Integer 分页查询时查询的起始位置,表示从第几条数据开始,默认为0 最小值:0 最大值:10000 limit 否 Integer 查询结果条数的限制值,取值范围为[1,100],默认值为100 最小值:1 最大值:100 namespace 否 String 查询服务的命名空间,各服务命名空间请参考“服务命名空间”
X-Auth-Token 是 String 用户Token。用户Token也就是调用获取用户Token接口的响应值,该接口是唯一不需要认证的接口。请求响应成功后在响应消息头中包含的“X-Subject-Token”的值即为Token值。 最小长度:1 最大长度:16000 响应参数 状态码: 200 表3
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬盘。 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 在页面右上角,选择“资源 > 我的配额”。
主机监控 针对众包平台中使用的ECS和BMS,ECS作为业务的计算资源,数据库部署在BMS上。因此,BMS的磁盘速度会影响数据库操作速度,ECS的内存和CPU占用大小等会影响业务执行速度,为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。 具体监控指标方面,可
查看云服务监控指标 云监控服务基于云服务自身的服务属性,已经内置了详细全面的监控指标。当您在云平台上开通云服务后,系统会根据服务类型自动关联该服务的监控指标,帮助您实时掌握云服务的各项性能指标,精确掌握云服务的运行情况。 本章节指导用户如何查看云服务资源的监控数据,若发现有异常时可以及时处理。
系统展示用户当前所有站点概况。包括站点名称、站点地址、探测类型、监控频率、可用探测点百分比、平均响应时间等。 单击站点名称所在行的“查看监控图表”。 进入“监控图表”页面。在此页面您可以根据需要查看该站点“近3小时”、“近12小时”和“近24小时”的监控原始数据曲线图。 图1 查看监控图表 当监控指标为可用性
查询主机监控维度指标信息 功能介绍 根据ECS/BMS资源ID查询磁盘、挂载点、进程、显卡、RAID控制器维度指标信息;维度NPU已经为原始值,不需要调用该接口进行额外查询获取指标信息 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer
> 云专线 > 虚拟接口”页面查询,一般填写远端网关地址;若为history-dc-nqa-collector插件,可在“控制台 > 云专线 > 历史信息”页面查询,可填写远端子网中的主机地址。 请确保监控资源ID与远端IP的一一对应,填写多个IP或填写网段均不符合要求。 安装完
本章节主要介绍如何在主机监控页面为弹性云服务器一键安装/升级Agent插件,为用户提供更加便捷的安装方式,请根据需要选择合适的安装方式。支持Agent一键安装的系统请参考Agent支持的系统有哪些? 表1 适用场景 安装方式 适用场景 安装&升级插件 已支持一键安装的主机资源,可在界面直接点
事件监控最佳实践 弹性云服务器事件 关系型数据库事件 弹性公网IP事件 父主题: 场景化实践案例
metric_name 是 String 告警模板添加的监控指标,如弹性云服务器可添加的监控指标为cpu_util等,各资源的监控指标名称可查看支持监控的服务列表。 condition 是 Condition object 创建自定义告警模板的告警策略。 详细参数说明请参见表4。 alarm_level
metric_name 是 String 告警模板添加的监控指标,如弹性云服务器可添加的监控指标为cpu_util等。 各资源的监控指标名称可查看支持监控的服务列表。 condition 是 Condition object 创建自定义告警模板的告警策略。 详细参数说明请参见表4。 alarm_level
终端节点 终端节点(Endpoint)即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 父主题: 使用前必读
配置关键字为:telescope,采集到的进程数:1。 配置关键字为:/usr/bin,采集到的进程数:3。 添加指定进程的操作步骤: 登录管理控制台。 单击“服务列表 > 云监控服务”。 根据需要查看的资源进行操作: 查看弹性云服务器的进程监控,选择“主机监控 > 弹性云服务器”进入主机监控界面; 查看裸金属服务器的进程监控,选择“主机监控