检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Agent一键修复后无监控数据问题排查 上报的指标被丢弃问题排查 Agent插件状态显示“故障”该如何处理? Agent插件状态显示“已停止”该如何处理? Agent插件状态显示“运行中”但没有数据该如何处理? Agent一键修复后无监控数据问题排查(老版本Agent) 如何获取Agent的Debug日志?
概述:在数字化时代,网络和服务的稳定性至关重要,通过拨测功能监控目标对象的可用性,确保业务稳定运行,提升企业效率和用户体验。 在数字化浪潮席卷之下,网络与服务的稳定性已成为社会秩序平稳运行的基石。任何网络或服务的突发故障,深度影响社会的整体运作、企业的持续运营以及民众日常生活的品质,其所造成的损失往往
视图。 用户可根据业务需求,拖动其中的监控视图,调整监控视图的顺序。 单击监控视图上方的“近1小时”、“近3小时”、“近12小时”、“近24小时”、“近7天”,可切换该监控看板下的所有视图的监控周期,其中“近1小时”以内的监控时长系统默认显示原始指标数据,其他时长周期默认显示聚合指标数据。
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现在拆线图和条形图中完成监控指标的增加、修改、删除等日常操作。 曲线图的操作步骤 登录管理控制台。
快速入门 概述 本节通过调用一系列云监控的API为ECS的cpu_util指标创建告警规则,当指标的数值达到设置的阈值时及时通知用户处理。 通过IAM服务获取到的Token有效期为24小时,需要使用同一个Token鉴权时,可以先将Token缓存,避免频繁调用。 操作步骤 Token认证,具体操作请参考认证鉴权。
是否必选 参数类型 描述 namespace 是 String 查询服务的命名空间,各服务命名空间请参考“服务命名空间” dimensions 是 Array of Dimension objects 资源的维度信息 数组长度:1 - 4 表5 Dimension 参数 是否必选
是否必选 参数类型 描述 namespace 是 String 查询服务的命名空间,各服务命名空间请参考“服务命名空间” dimensions 是 Array of Dimension objects 资源的维度信息 数组长度:1 - 4 表5 Dimension 参数 是否必选
CUSTOM表示自定义事件。 event_source String 否 事件名称,值为系统产生的事件名称,或用户自定义上报的事件名称。 event_level String 否 事件的级别,值为Critical、Major、Minor、Info。Critical为紧急,Major
当您不再需要某个资源分组时,可以对其执行删除操作。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“资源分组”,进入“资源分组”界面。 单击需要修改的分组行的“操作”列的“删除”按钮。 图1 删除资源分组 单击“确定”,可删除该资源分组。 父主题:
单击资源分组列表中待查看的分组名称,进入该资源分组的“资源概览”界面。 单击右侧的“告警规则”,即可展示该资源分组下的全部告警规则。 在该资源分组的“告警规则”界面中,可快速创建资源分组的告警规则。具体创建步骤请参见创建告警规则和通知。 图1 资源分组中的告警规则 父主题: 查看资源分组
网IP和公网IP字段,当选择系统模板作为通知内容模板时,发送告警通知时将不会显示这些字段。 默认模板是云监控服务提供的用户可选择的默认告警内容通知模板,不支持修改和删除。 除了系统模板和默认模板,云监控服务还支持用户自定义创建通知内容模板。用户可以根据需要配置通知内容模板的渠道类型、通知类型和通知内容等信息。
告警记录”,进入“告警记录”界面。 在告警记录页面,可查看近7天触发的告警的信息。 单击操作列的“查看监控详情”,右侧弹出监控详情页面,用户可查看资源的基本信息和最近一次告警状态改变数据。 图1 查看监控详情 在“告警记录”列表右上角可选择日历,查看近30天内的任意时间段内的告警记录。 在“告警记录”列表页面的
数”的统计。 告警统计 该数据统计的是近7天状态为“告警中”的告警级别明细和资源分组告警。告警级别明细中包含对“紧急告警”、“重要告警”、“次要告警”和“提示告警”的统计。 关键指标 展示了产品自主推荐的关键指标的监控详情。 在云服务看板详情页面中,单击左上角的选择框,可选择资源
资源概览界面显示当前分组中包含的资源类型、每个类型下包含的资源总数、维度、资源告警状态。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“资源分组”,进入“资源分组”页面。 单击资源分组列表中的其中一个分组名,进入分组资源概览界面。
时间范围:可选择查询最近七天内任意时间段的操作事件。 选择完查询条件后,单击“查询”。 在需要查看的记录左侧,单击展开该记录的详细信息,展开记录如图1所示。 图1 展开记录 在需要查看的记录右侧,单击“查看事件”,弹出一个窗口,如图2所示,显示了该操作事件结构的详细信息。 图2 查看事件的详细日志信息 父主题:
虚拟私有云为弹性云服务器构建隔离的、用户自主配置和管理的虚拟网络环境,提升用户云中资源的安全性,简化用户的网络部署。 当您的弹性云服务器要访问Internet时,您可使用虚拟私有云创建的弹性公网IP绑定到弹性云服务器上,弹性云服务器即可连接公网。不同弹性公网IP还可以共享带宽,减少您的带宽成本。 使
表3 响应Body参数 参数 参数类型 描述 template_id String 告警模板的ID,以at开头,后跟字母、数字,长度最长为64 template_name String 告警模板的名称,以字母或汉字开头,可包含字母、数字、汉字、_、-,长度范围[1,128] template_type
指定告警规则对应的策略总数 最小值:0 最大值:100 表5 ListPolicy 参数 参数类型 描述 metric_name String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_
云服务概览是对该类云服务资源使用情况的总览,包括资源概览、告警统计、关键指标三个部分。 资源概况统计资源的总数及正在告警的资源个数,以及7天告警的资源数。 告警统计是对当前所选云产品正在发生的告警数量进行的统计和汇总。 关键指标展示该类云服务资源的重点业务指标,并支持自定义编辑指标
检查应用和数据库之间的连接是否重新建立了连接。 复制状态异常 即主备之间复制时延太大(一般在写入大量数据,或者执行大事务的时候会出现),在业务低峰期备机会逐渐追上主机。还有另一种可能是主备间的网络中断,导致主备复制异常。但不会导致原来单实例的读写中断,客户的应用是无感知的。 提交工单处理。