检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“监控看板 > Dashboards”,单击“创建Dashboard”。 系统弹出“创建Dashboard”窗口。 配置参数。 名称:表示监控看板名称,该参数只能由中文、英文字母、数字、下划线、中划线组成,且长度不超过128。
本Agent) 问题现象 Agent一键修复后运行正常,但仍然没有监控数据。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时AK/SK失败 网络问题 首先需要确认使用的Agent版本。
则和通知。 查看系统进程数 云监控服务在您安装插件后,会默认展示系统的进程数据。 查看系统进程数的操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入“主机监控”页面。 单击资源所在行的“查看监控指标”,进入“操作系统监控”页面。 单击
安装GPU指标集成插件 通过在GPU加速型Linux实例上安装GPU监控插件,可以为用户提供系统级、主动式、细颗粒度的GPU监控,包含GPU指标收集和GPU系统事件上报。GPU支持监控的指标,参见GPU指标。 本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版GPU监控插件:
同的监控需求。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“我的看板 > 自定义监控看板”,单击“创建看板”。 系统弹出“创建看板”窗口。 配置参数。 名称:表示监控看板名称,该参数只能由中文、英文字母、数字、下划线、中划线组成,且长度不超过128。 归
我的配额”。 系统进入“服务配额”页面。 图1 我的配额 您可以在“服务配额”页面,查看各项资源的总配额及使用情况。 如果当前配额不能满足业务要求,请参考后续操作,申请扩大配额。 如何申请扩大配额? 登录管理控制台。 在页面右上角,选择“资源 > 我的配额”。 系统进入“服务配额”页面。
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工
事件即云监控保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。 事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明。 事件监控为您提供上报自定义事件的接
(Windows):暂不支持。 % 2.5.6 1分钟 操作系统监控指标: 文件系统 指标 指标名称 指标说明 单位 支持版本 监控周期(原始指标) disk_fs_rwstate (Agent)文件系统读写状态 该指标用于统计测量对象挂载文件系统的读写状态。状态分为:可读写(0)/只读(1)。
站点的访问情况。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“站点监控”。 进入“站点监控”界面。 系统展示用户当前所有站点概况。包括站点名称、站点地址、探测类型、监控频率、可用探测点百分比、平均响应时间等。 单击站点名称所在行的“查看监控图表”。
请参见https://console.huaweicloud.com/apiexplorer/#/sdkcenter/CES?lang=Java。 父主题: 使用前必读
扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性,并且使用云监控的事件监控功能对服务器运行异常及自动恢复进行监控,订阅事件告警同步进行业务处理。 表1 ECS重点事件 事件名称 事件说明 处理步骤 因硬件故障触发重启 弹性云服务器所在的主机出现故障时,系统会自动将
搭建业务的系统级监控。 本文介绍云监控服务常用最佳实践,帮助您更好的使用云监控服务。 表1 常用最佳实践 实践 描述 电商平台 电商平台最佳实践 电商业务对内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。
动态阈值:指告警触发阈值是根据智能计算指标的历史数据预测指标的阈值,若实际值偏离预测值,则触发告警。 静态阈值 事件类型 当告警类型选择事件时,需要选择事件类型,可选择系统事件或自定义事件。 系统事件 事件来源 当告警类型选择事件时,需要设置事件来源。 当事件类型选择系统事件时,需要选择事件来源的云服务名称。
选择“FunctionGraph函数”,选择对应的函数和函数版本。 选择“FunctionGraph”,选择对应的工作流。 选择“钉钉”,需要在钉钉的群设置中选择“智能群助手”,添加机器人时选择“自定义”,创建完成后即可获得webhook地址。 例如: https://qyapi.weixin.qq.co
登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“主机监控 > 弹性云服务器”。 单击需要查看资源详情的监控名称,进入“操作系统监控”界面。 单击右上角“查看资源详情”,弹出“查看资源详情”窗口。 可查看该监控的实例名称、实例ID、资源分组情况。 父主题: 主机监控
的权限。 图1 修改CES授权范围 功能优势 支持创建、修改、停用、启用、删除站点监控。 提供简单的添加配置,不再浪费资源和精力配置复杂的开源产品。 支持站点异常告警,不用担心网站出问题而无人知晓。 命名空间 SYS.REMOTE_CHECK 监控指标 表1 站点监控指标说明 指标ID
支持对告警规则进行启用、停止、删除等灵活操作。 实时通知: 通过在告警规则中开启消息通知服务,当云服务的状态变化触发告警规则设置的阈值时,系统通过短信、邮件通知或发送消息至服务器地址等多种方式实时通知用户,让用户能够实时掌握云资源运行状态变化。 监控面板: 为用户提供在一个监控面
Agent插件资源占用和熔断说明 资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保