正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
事件监控简介 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。事件监控不依赖于Agent插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现在拆线图和条形图中完成监控指标的增加、修改、删除等日常操作。 曲线图的操作步骤 登录管理控制台。
当主机挂载磁盘数量较多时,Agent占用的CPU或内存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。 可选:执行以下命令,切换至Agent安装路径的bin下。 Windo
当告警触发后,我们需要定义通知的渠道和对象,快速的将告警信息通过配置的渠道通知到运维人员。 当前CES支持以下三种方式来完成通知的配置。 通知策略(推荐):产品最新上线能力,通过通知策略可以完成告警的分级通知、简易排班。 通知组:通过在云监控服务上配置的通知群组,可以快速通知到指定运维人员。
数”的统计。 告警统计 该数据统计的是近7天状态为“告警中”的告警级别明细和资源分组告警。告警级别明细中包含对“紧急告警”、“重要告警”、“次要告警”和“提示告警”的统计。 关键指标 展示了产品自主推荐的关键指标的监控详情。 在云服务看板详情页面中,单击左上角的选择框,可选择资源
监控视图添加完成后,您可以在我的看板页面查看该监控项的监控走势图。系统提供固定时长和自定义时长两种方式查看监控走势图。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“我的看板”。 单击需要查看监控视图的看板名称,查看我的看板下的所有监控视图。 在监控视图页面
通过资源分组实现云资源分组监控 对于有一定资源规模的组织或企业而言,资源数量大多会因为人工维护繁琐导致易出错,同时应用于不同生产环节的资源可能需要分组管理,例如用于测试和用于生产的资源相比,需要配置的监控与告警、通知渠道与接收用户也可能不一样。云监控支持根据实例名称、实例标签、企
Agent支持的系统有哪些?。 支持的GPU加速型规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1。 暂不支持CCE纳管后的GPU加速型实例。 前提条件 已安装GPU驱动,未安装lspci工具的云服务器影响GPU掉卡事件的上报。 如果您的弹性云服务器未安
155天 “亚太-曼谷”的指标数据最长保留周期为一年,聚合周期为24小时。 若需要将数据保存更长时间,可对数据进行转储保存。具体操作请参考数据转储。 如果某个资源实例被停用、关闭或者删除,相应的原始指标数据停止上报1小时后,实例相关的指标就被删除。停用或关闭的实例被重新启用后,指标
排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Agent上报数据时取的是ECS或BMS的操作系统本地时间,管理控制台下发的请求时间范围是依赖用户客户端浏览器的时间,两者如果不匹配则可能导致管理控制台查不到操作系统监控数据。 修改裸金属服务器和云监控服务时间一致参考命令:timedatectl
视图。 用户可根据业务需求,拖动其中的监控视图,调整监控视图的顺序。 单击监控视图上方的“近1小时”、“近3小时”、“近12小时”、“近24小时”、“近7天”,可切换该监控看板下的所有视图的监控周期,其中“近1小时”以内的监控时长系统默认显示原始指标数据,其他时长周期默认显示聚合指标数据。
单击需要开启的云服务资源所在行右侧的一键告警开关,开启一键告警。 图1 开启一键告警 单击一键告警左侧的下拉按钮,可查看、修改或重置已开启的告警规则。 单击需要修改的告警规则所在行右侧的“修改”,可删除或添加告警策略,可根据需求设置发送通知。 单击资源类型所在行右侧的“重置”,可
虚拟私有云为弹性云服务器构建隔离的、用户自主配置和管理的虚拟网络环境,提升用户云中资源的安全性,简化用户的网络部署。 当您的弹性云服务器要访问Internet时,您可使用虚拟私有云创建的弹性公网IP绑定到弹性云服务器上,弹性云服务器即可连接公网。不同弹性公网IP还可以共享带宽,减少您的带宽成本。 使
等指标,详见云产品监控指标。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。 目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 ECS规格建议Linux使用“2vCPUs |
指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 字符格式必须以字母开头,只能包含0-9/a-z/A-Z/_-,字符长度最短为1,最大为96。 dim 否 String 监控维度,例如弹性云服务器的维度为in
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应
时间范围:可选择查询最近七天内任意时间段的操作事件。 在需要查看的记录左侧,单击展开该记录的详细信息,展开记录如图1所示。 图1 展开记录 在需要查看的记录右侧,单击“查看事件”,弹出一个窗口,如图2所示,显示了该操作事件结构的详细信息。 图2 查看事件的详细日志信息 父主题: 操作记录审计
、使用中的数据库连接数等其他监控指标可根据您的实际情况来设置。 建议将弹性公网IP和带宽的出网带宽使用率告警阈值设置为80%,连续三次超过阈值后开始告警。其他监控指标可根据您的实际情况来设置。 单击“立即创建”,完成告警规则的创建。 当业务量飙升,RDS、弹性公网IP和带宽或EL
检查应用和数据库之间的连接是否重新建立了连接。 复制状态异常 即主备之间复制时延太大(一般在写入大量数据,或者执行大事务的时候会出现),在业务低峰期备机会逐渐追上主机。还有另一种可能是主备间的网络中断,导致主备复制异常。但不会导致原来单实例的读写中断,客户的应用是无感知的。 提交工单处理。
以主账户或子账号(拥有创建自定义策略和给其他子账号授权的权限)登录华为云管理控制台。 确认主账号已开启该区域插件权限,在云监控服务中单击“主机监控 - 弹性云服务器”,若页面上方未显示“一键配置”,则说明已开启该区域插件权限,否则需要单击“一键配置”来开启该区域插件权限。 鼠标移动至右上方的用户名,在下拉列表中选择“统一身份认证”。