检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
钟,休眠期间,不会采集监控数据。 当主机挂载磁盘数量较多时,Agent占用的CPU或内存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。 可选:执行以下
项目ID。 获取方式请参见获取项目ID。 group_name String 否 资源分组的名称,如:Resource-Group-ECS-01。 group_id String 否 资源分组的ID,如:rg1603786526428bWbVmk4rP。 status String
4命令采集。 内存的设备信息 内存条的SN、厂商、PN、位宽、容量、频率等。 使用dmidecode -t 17命令采集。 CPU的设备信息 CPU的ID、名称、频率、架构、型号等。 使用dmidecode -t 4和lscpu命令采集。 内存的错误记录 内存的CE/UCE错误记
监控大盘简介 监控大盘是根据一些重点云服务的资源水位使用情况、核心业务指标的推荐,内置的默认监控看板。用户仅需简单的开启大盘即可创建完成重点服务的看板视图,方便可视化观测云上资源的各类核心重点指标数据。 监控大盘适用于对重点云服务资源有整体资源监控使用情况观测的场景。若您想要快速对整体资源进
云服务概览是对该类云服务资源使用情况的总览,包括资源概览、告警统计、关键指标三个部分。 资源概况统计资源的总数及正在告警的资源个数,以及7天告警的资源数。 告警统计是对当前所选云产品正在发生的告警数量进行的统计和汇总。 关键指标展示该类云服务资源的重点业务指标,并支持自定义编辑指标
新版本)。 安装最新版本的Agent,安装命令参见Linux系统。 使用具有“管理员”权限的账号(例如,administrator)登录Windows弹性云服务器。 根据Agent安装路径判断当前Agent版本,方法参见Windows平台。 卸载当前版本的Agent,卸载命令参见卸载Agent。
企业项目的子用户在配置告警规则时,无法选择全部资源 告警通知是什么,分为几类? 告警状态有哪些? 告警级别有哪些? 如何查看数据盘的磁盘使用率和创建告警通知? 如何修改告警通知中云账号联系人和主题订阅者的电话、邮箱等信息? 如何将告警通知发送给子账号?
Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。
project_id 是 项目ID。 获取方式请参见获取项目ID。 template_id 是 需要删除的自定义告警模板ID。 样例 DELETE https://{云监控的endpoint}/V1.0/{project_id}/alarm-template/at1603252280799wLRyGLxnz
表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。 period Integer 指标周期,单位是秒; 0是默认值,例如事件类告警该字段就用0即可; 1代表指标的原始周期
是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 alarm_id 是 告警规则的ID。 样例 DELETE https://{云监控的endpoint}/V1.0/{project_id}/alarms/al1441967036681YkazZ0deN
9]|100)$ 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 Content-Type 是 String 发送的实体的MIME类型。默认使用application/json; charset=UTF-8。 缺省值:application/json; charset=UTF-8
是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 alarm_id 是 告警规则的ID。 样例 PUT https://{云监控的endpoint}/V1.0/{project_id}/alarms/al1441967036681YkazZ0deN/action
24小时”、“近7天”以内的监控时长系统默认显示聚合指标数据。 整体探测分析如下图所示,可查看可用率、平均响应时间、城市最慢TOP5、运营商最慢TOP5、错误类型TOP5。 管理广域网质量监控 在“监控任务”页面,单击待修改的广域网质量监控所在行的“修改任务”。 进入“编辑任务”界面。
资源数(告警中/已触发/资源总数) 组内所有正在告警的资源数/已触发告警的资源数/组内所有资源的数量。 资源类型数 组内资源类型的数量,例如组内有2台弹性云服务器 、1个云硬盘两种资源类型,则资源类型数为2。 归属企业项目 拥有资源分组权限的企业项目名称。 创建方式 创建资源分组的方式,有手动添加和智能添加两种。
编辑关键指标 站点监控 站点监控展示了目标站点的响应时间和可用性、近一小时响应时间数据平均值和近一小时可用性数据平均值。 目标站点响应时间默认轮播展示所有站点资源的探测点响应时间,选择单个站点名称后地图会轮播展示所选站点各探测点的响应时间,方便用户了解站点整体性能,及时处理异常情况。 目
数/成功上报数据的探测点数*100%。 平均响应时间 该指标为所选探测点的平均响应时间。 城市最慢TOP5 平均耗时最长的前5个城市。 运营商最慢TOP5 平均耗时最长的前5个运营商。 错误类型TOP5 出现次数最多的前5种错误类型。 单击“中国地图”旁图标,可进行阈值配置。 单
正则匹配:^[a-zA-Z0-9-]{1,64}$ 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Content-Type 是 String 发送的实体的MIME类型。默认使用application/json; charset=UTF-8。 缺省值:application/json; charset=UTF-8
告警状态为告警中、已触发或数据不足时,可手动恢复告警记录。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警记录”,进入“告警记录”界面。 在告警记录页面,可查看近7天触发的告警的信息。 单击操作列的“手动恢复”。 弹出确定手动恢复的对话框。 图1 手动恢复
当告警触发后,我们需要定义通知的渠道和对象,快速的将告警信息通过配置的渠道通知到运维人员。 当前CES支持以下三种方式来完成通知的配置。 通知策略(推荐):产品最新上线能力,通过通知策略可以完成告警的分级通知、简易排班。 通知组:通过在云监控服务上配置的通知群组,可以快速通知到指定运维人员。