检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
为了更加安全高效的使用云监控服务提供的主机监控功能,我们提供了最新方式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Agent做临时AK
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现在拆线图和条形图中完成监控指标的增加、修改、删除等日常操作。 曲线图的操作步骤 登录管理控制台。
快速入门 概述 本节通过调用一系列云监控的API为ECS的cpu_util指标创建告警规则,当指标的数值达到设置的阈值时及时通知用户处理。 通过IAM服务获取到的Token有效期为24小时,需要使用同一个Token鉴权时,可以先将Token缓存,避免频繁调用。 操作步骤 Token认证,具体操作请参考认证鉴权。
企业项目的子用户在配置告警规则时,无法选择全部资源 告警通知是什么,分为几类? 告警状态有哪些? 告警级别有哪些? 如何查看数据盘的磁盘使用率和创建告警通知? 如何修改告警通知中云账号联系人和主题订阅者的电话、邮箱等信息? 如何将告警通知发送给子账号? 为什么告警通知内容中不显示资源名称?
告警通知系统模板更新记录 云监控服务930版本将短信告警通知系统模板中的告警信息进行了修改,具体变更信息如表1 短信-指标系统通知模板、表2 短信-系统事件系统通知模板和表3 短信-自定义事件系统通知模板所示: 表1 短信-指标系统通知模板 信息 变更操作 告警恢复状态 新增 跳转连接
Agent支持的系统有哪些?。 支持的GPU加速型规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1。 暂不支持CCE纳管后的GPU加速型实例。 前提条件 已安装GPU驱动,未安装lspci工具的云服务器影响GPU掉卡事件的上报。 如果您的弹性云服务器未安
历史告警保存时间 7天 单次创建告警规则可选择的被监控对象数 5000 单次可创建告警规则条数 1000 说明: 若选择监控对象为50个,监控指标为20个,则可创建的告警规则条数为1000。 发送通知可选择主题数 5 单次导出监控数据条数 400 说明: 若监控对象为400个,则监控指
DataPointInfo 参数 参数类型 描述 time String 计算出该条告警记录的资源监控数据上报的UTC时间 最小长度:1 最大长度:64 value Double 计算出该条告警记录的资源监控数据在该时间点的监控数值,如:7.019。 最小值:0 最大值:1.7976931348623157E308
Agent如何通过授权获取临时AK/SK? Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束 BMS硬件监控指标采集说明 什么是插件修复配置?
是 创建的资源分组选择一个或者多个资源。 详细参数说明请参见表3。 表3 resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
在告警记录页面,可查看近7天触发的告警的信息。 单击操作列的“手动恢复”。 弹出确定手动恢复的对话框。 图1 手动恢复 单击“确定”,确定手动恢复。 当资源仍处于告警状态时,不建议执行手动恢复,此时如果执行手动恢复,则告警将在下一个告警频率时段内触发。 例如配置的告警频率为每1天告警一次
告警记录”,进入“告警记录”界面。 在告警记录页面,可查看近7天触发的告警的信息。 单击操作列的“查看监控详情”,右侧弹出监控详情页面,用户可查看资源的基本信息和最近一次告警状态改变数据。 图1 查看监控详情 在“告警记录”列表右上角可选择日历,查看近30天内的任意时间段内的告警记录。 在“告警记录”列表页面的
启用站点监控 在“站点监控”界面,单击状态为“已停用”的站点所在行的“更多 > 启用站点监控”,在弹出的“启用站点监控”界面,单击“是”,可以启用站点监控。 或者在“站点监控”界面,勾选多个监控站点,单击列表上方的“启用”,在弹出的“启用站点监控”界面,单击“确定”,可以启用站点监控。
指定告警规则对应的策略总数 最小值:0 最大值:100 表5 ListPolicy 参数 参数类型 描述 metric_name String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_
String 告警模板的名称,以字母或汉字开头,可包含字母、数字、汉字、_、-,长度范围[1,128] template_type 否 Integer 自定义告警模板类型 0:指标 2: 事件 枚举值: 0 2 template_description 否 String 告警模板的描述,长度范围[0
在“监控任务”页面。单击需删除任务所在行的“更多 > 删除”,在弹出的“删除任务”界面,确定待删除的广域网质量监控任务后,输入“DELETE”,可以删除广域网质量监控。 或者在“监控任务”页面,勾选需删除的多个监控任务,单击列表上方的“删除”,在弹出的“删除任务”界面,确定待删除的广域网质量监控任务后
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
表3 响应Body参数 参数 参数类型 描述 template_id String 告警模板的ID,以at开头,后跟字母、数字,长度最长为64 template_name String 告警模板的名称,以字母或汉字开头,可包含字母、数字、汉字、_、-,长度范围[1,128] template_type
String 告警模板的名称,以字母或汉字开头,可包含字母、数字、汉字、_、-,长度范围[1,128] template_type 否 Integer 自定义告警模板类型 0:指标 2: 事件 枚举值: 0 2 template_description 否 String 告警模板的描述,长度范围[0