检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
这里以平时的SNAT连接数为10000为例,高峰期为平时的2-3倍,因此配置SNAT连接数为30000的告警规则。 出网带宽使用率建议配置为80%。 “告警通知”功能触发产生的告警消息由消息通知服务SMN发送,可能产生少量费用,具体费用请参考产品价格说明。
此外,您还能观察到不同地域运营商线路探测点到服务的网络响应时间时延,了解不同地域运营商的用户访问时延体验,可为系统部署架构优化提供参考依据。
添加监控数据 功能介绍 添加一条或多条自定义指标监控数据,解决系统监控指标不能满足具体业务需求的场景。 监控数据保留时间请参见《云监控服务用户指南》的“指标数据保留多长时间”章节。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成
导出告警规则 如果需要查看当前账号下资源配置的告警规则信息,可以导出告警规则。本章节指导用户如何导出告警规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警规则”,进入“告警规则”界面。 单击左上角的“导出”按钮。
在“添加监控视图”界面,参照表1完成参数配置。 表1 配置参数 参数 参数说明 标题 自定义关注指标组件的标题名称,该名称只能由中文、英文字母、数字、下划线、中划线组成,长度限制为128字节。
在“通知对象”页签,单击“创建通知对象”或单击已有通知对象的“编辑”操作进入配置页面。 单击“选择渠道”,勾选“企业微信”选项。 将企业微信机器人的Webhook填入相应的输入框中,确认无误后单击“确定”保存配置。
在“通知对象”页签,单击“创建通知对象”,或单击已有通知对象的“编辑”操作进入配置页面。 单击“选择渠道”,勾选“钉钉”选项。 将钉钉机器人的Webhook填入相应的输入框中。 将密钥或是自定义关键词填入相应的输入框中,确认无误后单击“确定”保存配置。
单击页面左侧的“事件监控”,在事件监控页面,单击页面右上角的创建告警规则,根据界面提示配置参数。 事件名称以“实例全量备份失败”为例,请根据实际情况配置,具体参数说明请参见创建告警规则。 配置完成后,单击“立即创建”,完成创建告警规则。
在弹出的“修改告警规则”页面中修改告警规则配置参数。 修改告警规则时,告警类型、云产品、资源层级和监控范围的参数为默认值,不可修改,若监控范围是“全部资源”时,可单击“选择排除资源”排除指定资源。其它参数请参考5进行配置。 单击“立即修改”,完成告警规则的修改。
应用场景 创建通知对象、创建告警规则时需要配置通知渠道。 操作步骤 登录管理控制台。 选择“支持与服务”,单击左下方“工单服务”。 选择问题所属产品:在输入框中输入“SMN”,单击“消息通知服务(SMN)”进入下一步。
配置参数。 名称:表示监控看板名称,该参数只能由中文、英文字母、数字、下划线、中划线组成,且长度不超过128。 归属企业项目:将监控看板关联给到某个企业项目时,只有拥有该企业项目所有权限的用户才可以查看和管理该监控看板。 企业项目仅在部分区域上线。
下面将展示如何配置指标类和事件类的告警策略。 配置指标类告警策略 用户可以针对云服务的核心监控指标设置指标告警,在发生异常时及时通知您采取措施。指标类告警策略包括指标名称、指标值类型、连续触发次数、阈值和告警频率五个必要组成部分。您可以根据以下指引配置告警类告警策略。
若您想要快速对整体资源进行视图创建,同时不清楚配置哪些指标时,推荐使用监控大盘功能。 父主题: 监控大盘
进入“修改告警规则”界面,根据界面提示配置参数,参数如5所示。 单击“立即修改”,完成修改操作。 启用告警规则 在“告警规则”页面。单击已停用任务所在行的“更多 > 启用”,在弹出的“启用告警规则”界面,单击“确定”,可以启用告警规则。
在“添加转储任务”页面根据界面提示配置参数,参数说明如表1所示。 图1 添加转储任务 表1 转储任务配置参数说明 参数 参数说明 名称 转储任务名。 取值范围:只能由中文、英文字母、数字、下划线、中划线组成。长度范围:1-128个字符。
建议针对业务所涉及的弹性公网IP、带宽配置告警规则,出网带宽使用率,阈值设置为“原始值”“≥”购买带宽的90%。 根据界面提示配置名称、描述和告警规则和告警通知参数。 单击“立即创建”,完成创建告警规则。
其他原因:请点击“操作”列“修改”按钮,重新配置转储目标信息,启动任务,观察转储任务能否恢复正常。 父主题: 数据转储
监控数据管理 查询监控数据 添加监控数据 批量查询监控数据 查询主机配置数据 父主题: 云资源监控
Agent支持的指标列表 操作系统指标: CPU 指标 指标名称 指标说明 单位 支持版本 监控周期(原始指标) cpu_usage (Agent)CPU使用率 该指标用于统计测量对象当前CPU使用率。 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu
单击页面左侧的“事件监控”,在事件监控页面,单击相页面右上角的创建告警规则,根据界面提示配置参数。 事件名称分别配置因硬件故障触发重启、因硬件故障重启已完成,具体参数说明请参见创建告警规则。 配置完成后,单击“立即创建”,完成创建告警规则。