检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
系统弹出“创建Dashboard”窗口。 配置参数。 名称:表示监控看板名称,该参数只能由中文、英文字母、数字、下划线、中划线组成,且长度不超过128。 归属企业项目:将监控看板关联给到某个企业项目时,只有拥有该企业项目权限的用户才可以查看和管理该监控看板。
环境准备 以Ubuntu 18.04系统和Prometheus 2.14.0版本为例。
安装GPU指标集成插件 操作场景 通过在GPU加速型Linux实例上安装GPU监控插件,可以为用户提供系统级、主动式、细颗粒度的GPU监控,包含GPU指标收集和GPU系统事件上报。GPU支持监控的指标,参见GPU指标。
ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口,双12、618等大型购物节会导致不同网络用户访问电商网站出现网页打开慢、网络延时高等问题。
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。
系统弹出“创建看板”窗口。 配置参数。 名称:表示监控看板名称,该参数只能由中文、英文字母、数字、下划线、中划线组成,且长度不超过128。 归属企业项目:将监控看板关联给到某个企业项目时,只有拥有该企业项目所有权限的用户才可以查看和管理该监控看板。 企业项目仅在部分区域上线。
系统进入“服务配额”页面。 图1 我的配额 您可以在“服务配额”页面,查看各项资源的总配额及使用情况。 如果当前配额不能满足业务要求,请参考后续操作,申请扩大配额。 如何申请扩大配额? 登录管理控制台。 在页面右上角,选择“资源 > 我的配额”。 系统进入“服务配额”页面。
您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。 事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明。
“近1小时”、“近3小时”、“近12小时”、“近24小时”的监控数据:系统默认显示原始数据。您可以选单击页面左上方的“设置”选项,对监控数据的聚合周期进行更改。聚合周期请参考什么是聚合?。 “近7天”、“近30天”的监控数据:系统默认显示聚合后的数据。
系统展示用户当前所有站点概况。包括站点名称、站点地址、探测类型、监控频率、可用探测点百分比、平均响应时间等。 单击站点名称所在行的“查看监控图表”。 进入“监控图表”页面。在此页面您可以根据需要查看该站点“近3小时”、“近12小时”和“近24小时”的监控原始数据曲线图。
入门实践 当您了解了云监控服务的功能后,可以根据自身的业务需求使用云监控服务搭建业务的系统级监控。 本文介绍云监控服务常用最佳实践,帮助您更好的使用云监控服务。
因此需使用弹性负载均衡将访问流量根据转发策略分发到后端多台弹性云服务器,通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性,并且使用云监控的事件监控功能对服务器运行异常及自动恢复进行监控,订阅事件告警同步进行业务处理。
怎样让新购ECS实例中带有操作系统监控功能? Agent各种状态说明及异常状态处理方法 基础监控与操作系统监控数据出现不一致的问题 云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 未安装UVP VMTools对弹性云服务器监控指标有什么影响?
监控插件实现硬件的故障风险检查时,仅会采集一些必要的系统指标用作巡检,详情见硬件监控指标采集说明。 仅支持部分Linux操作系统,详情见:Agent支持的系统有哪些?。 支持的规格:所有规格的BMS。
修复Linux ubuntu系统/snap/挂载点误告警问题。 2.6.4.1版本 基于2.6.4版本: 增加GPU指标。 增加NPU指标 增加物理机硬件监控能力。详情说明参考BMS硬件监控插件说明。 2.6.4版本 增加UDP连接总数指标。
图7 查看监控指标 图8 操作系统监控 进入指标详情页展示操作系统监控和基础监控,操作系统监控下展示的指标就是安装了Agent之后会展示出来的指标,如果操作系统监控为空,可以安装Agent成功之后再进行查看。
完成工单提交:等待系统回复,当出现华为云工程师系统角色提示您确认风险的回复后,输入“风险已知晓,继续开通”,等待系统回复,完成公测协议开通。 企业微信群消息,钉钉群消息,飞书群消息有发送条数限制和接收方系统故障情况,可能会导致消息发送失败。
Agent插件资源占用和熔断说明 资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。
您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。 事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明。
单击“操作系统监控”右侧的“进程监控”,进入“进程监控”页面。 在“系统进程数”页面,展示了主机上运行的进程数据。系统进程查询结果的指标说明如表2所示。