检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何修改告警通知中云账号联系人和主题订阅者的电话、邮箱等信息? 云监控的告警通知对象可以是“云账号联系人”也可以是主题的订阅者。 下面为您介绍当通知对象分别是“云账号联系人”或主题的订阅者时的电话和邮箱修改方法。 云账号联系人为告警通知对象时 当您设置的告警通知联系人为“云账号联系人”时
Agent上报数据时取的是ECS或BMS的操作系统本地时间,管理控制台下发的请求时间范围是依赖用户客户端浏览器的时间,两者如果不匹配则可能导致管理控制台查不到操作系统监控数据。 修改裸金属服务器和用户客户端浏览器时间一致参考命令:timedatectl set-timezone 'Asia/Shanghai'。
配置关键字为:telescope,采集到的进程数:1。 配置关键字为:usr,采集到的进程数:3。 添加指定进程的操作步骤: 登录管理控制台。 单击“服务列表 > 云监控服务”。 根据需要查看的资源进行操作: 查看弹性云服务器的进程监控,选择“主机监控 > 弹性云服务器”进入主机监控界面; 查看裸金属服务器的进程监控,选择“主机监控
如何将告警通知发送给子账号? 如您想要将告警通知发给子账号,可以通过创建主题并添加订阅(在订阅信息中配置您的手机号码或邮箱),然后在创建告警规则时选择告警通知对象为您创建的主题 。 父主题: 告警
GPU驱动正常安装后,最多10分钟将在控制台看到采集到的GPU指标数据。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法,请参见安装lspci工具。 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
处理。 当安装硬件监控插件后,硬件故障风险会以事件的方式主动通知到用户,需要用户及时授权对风险硬件的维修或更换。 监控插件实现硬件的故障风险检查时,仅会采集一些必要的系统指标用作巡检,详情见硬件监控指标采集说明。 仅支持部分Linux操作系统,详情见:Agent支持的系统有哪些?。
告警中:监控指标数值达到告警配置阈值,资源正在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致; 已触发:监控的资源触发了告警策略中配置的事件; 已失效:告警规则中监控的资源或告警策略有调整,原有的告警记录状态失效。
和支持监控的服务列表,有助于您快速适配您的业务场景选择合适的资源监控方式和告警通知方式。 产品介绍 什么是云监控服务 云监控服务相关概念 支持监控的服务列表 服务优势 03 使用 为您全面展示华为云云监控服务的监控面板、主机监控Agent、告警规则和告警通知等功能的详细使用方法和步骤。
在“告警规则”界面,单击待修改告警规则所在行“操作”列的“修改”按钮; 在“告警规则”界面,选择待修改告警规则名称,进入告警规则详情页面,单击右上角“修改”。 在弹出的“修改告警规则”页面中修改告警规则配置参数。 修改告警规则时,告警类型、云产品、资源层级和监控范围的参数为默认值,不可修改,若监控范围
Request 服务器未能处理请求。 401 Unauthorized 被请求的页面需要用户名和密码。 403 Forbidden 对被请求页面的访问被禁止。 404 Not Found 服务器无法找到被请求的页面。 405 Method Not Allowed 请求中指定的方法不被允许。
当前监控站点的探测协议,无需配置。 监控范围 告警规则适用的资源范围,默认为指定资源,无需配置。 监控对象 告警规则适用的具体资源,默认为当前选择的资源,无需配置。 说明: 当监控对象为指定资源时,可新增多个监控对象,并可解除原监控对象。 触发规则 选择配置告警策略的方式,当告警类型为站点时,只支持自定义创建。
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 alarm_id 是 告警规则的ID。 样例 DELETE https://{云监控的endpoint}/V1.0/{project_id}/alarms/al1441967036681YkazZ0deN
而可以更好的使用云监控服务。 监控指标 聚合 监控面板 主题 告警规则 告警模板 项目 企业项目 监控指标 监控指标是云监控服务的核心概念,通常是指云平台上某个资源的某个维度状态的量化值,如云服务器的CPU使用率、内存使用率等。监控指标是与时间有关的变量值,会随着时间的变化产生一
查看主机监控的资源详情 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“主机监控 > 弹性云服务器”。 单击需要查看资源详情的监控名称,进入“操作系统监控”界面。 单击右上角“查看资源详情”,弹出“查看资源详情”窗口。 可查看该监控的实例名称、实例ID、资源分组情况。
主机监控Agent对主机的性能会有影响吗? 主机监控Agent占用的系统资源很小,性能基本不会受到影响。 在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装Agent资源占用情况如下:
是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 alarm_id 是 告警规则的ID。 样例 PUT https://{云监控的endpoint}/V1.0/{project_id}/alarms/al1441967036681YkazZ0deN/action
Agent插件状态显示“运行中”但没有数据该如何处理? Agent安装完成后请等待10分钟,若仍然无数据,一般为conf文件中InstanceId配置错误。 请参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 父主题: 主机监控
支持GPU监控的环境约束 BMS硬件监控指标采集说明 什么是插件修复配置? 怎样让新购ECS实例中带有操作系统监控功能? Agent各种状态说明及异常状态处理方法 基础监控与操作系统监控数据出现不一致的问题 云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 未安装UVP
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令: