检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警? 问题现象 告警规则配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到告警阈值却触发了告警。 问题分析 弹性云服务器实例下有A、B两个磁盘,当磁盘A的读指标和磁盘B的写指标同时达
在“网关和DNS”区域单击“DNS服务器地址”后的。 DNS服务器地址与3中的nameserver保持一致。 图3 修改DNS服务器地址 单击“确定”,保存设置。 在控制台修改DNS需重启ECS或BMS后生效。 安全组 修改ECS的安全组规则(管理控制台) 本节介绍登录管理控制台后修改ECS安全组
在“网关和DNS”区域单击“DNS服务器地址”后的。 DNS服务器地址与3中的nameserver保持一致。 图3 修改DNS服务器地址 单击“确定”,保存设置。 在控制台修改DNS需重启ECS或BMS后生效。 修改ECS的安全组规则(管理控制台) 本节介绍登录管理控制台后修改ECS安全组规则的操
主机监控配置监控及告警的全流程介绍 主机资源作为最重要的云上资源,如何做好对它的监控、告警,在实际的运维过程中尤为重要,本文主要介绍主机如何进行监控及配置告警。 应用场景 当用户购买了主机资源后,对于资源的运行状态需要进行必要的监控,以及对重点业务指标进行配置监控告警,能及时准确掌握主机资源的云上运行状态。
创建事件监控的告警通知 操作场景 本章节指导用户针对事件监控创建告警规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“事件监控”。 在事件列表页面,单击页面右上角的“创建告警规则”。 在“创建告警规则”界面,配置参数。 配置告警规则的基本信息。
“进程数量”在配置自定义监控时不需要配置,在您配置进程关键字后系统随后会自动刷新展示匹配关键字的进程数量。 配置完成后,您可以在“进程监控”页面的“自定义进程监控”区域框查看您设置的自定义进程的数量。 批量添加进程监控的操作步骤: 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“主机监控 > 进程监控”。
是 Condition object 创建自定义告警模板的告警策略。 详细参数说明请参见表4。 alarm_level 否 Integer 设置告警级别,值为1、2、3、4。其中1为紧急,2为重要,3为次要,4为提示。 表4 condition字段数据结构说明 名称 是否必选 参数类型
您可以从地区和终端节点获取。 scope参数定义了Token的作用域,下面示例中获取的Token仅能访问project下的资源。您还可以设置Token的作用域为某个账号下所有资源或账号的某个project下的资源,详细定义请参见获取用户Token。 1 2 3 4 5
当重要事件发生时,立即触发告警通知。 优势:配置简单,一键式打开开关。 弹性云服务器、弹性公网IP和关系型数据库的重要事件。 事件监控 指标监控 立即触发 普通告警 根据设置的告警策略触发告警。例如:CPU利用率在5分钟内的平均值连续5次>=80%时发送告警通知。 优势:告警策略更加灵活,可根据业务情况灵活配置。
1m # 设置prometheus从exporter查询数据的间隔时间,prometheus配置文件中默认为15s,建议设置为1m scrape_timeout: 1m # 设置从exporter查询数据的超时时间,prometheus配置文件中默认为15s,建议设置为1m scrape_configs:
查询数据起始时间,UNIX时间戳,单位毫秒(ms)。 由于聚合运算的过程是将一个聚合周期范围内的数据点聚合到周期起始边界上,如果将from和to的范围设置在聚合周期内,会因为聚合未完成而造成查询数据为空,所以建议from参数相对于当前时间向前偏移至少1个周期。 以5分钟聚合周期为例:假设当前
Condition object 是 创建自定义告警模板的告警策略。 详细参数说明请参见表4。 alarm_level Integer 否 设置告警级别。值为1、2、3、4。其中1为紧急,2为重要,3为次要,4为提示。 表4 condition字段数据结构说明 名称 参数类型 是否必选
status 否 String 按状态信息进行过滤,取值只能为health(已设置告警规则且无告警触发的资源)、unhealthy(已设置告警规则且有告警触发的资源)、no_alarm_rule(未设置告警规则的资源) 枚举值: health unhealthy no_alarm_rule
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CT
m的值相对于当前时间向前偏移至少1个周期。由于聚合运算的过程是将一个聚合周期范围内的数据点聚合到周期起始边界上,如果将from和to的范围设置在聚合周期内,会因为聚合未完成而造成查询数据为空,所以建议from参数相对于当前时间向前偏移至少1个周期。以5分钟聚合周期为例:假设当前时
Agent一键修复失败问题排查 问题现象 安装主机监控Agent后,单击“修复插件配置”后,插件状态仍然是“配置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /u
主机监控 如何配置DNS和安全组? 如何配置委托? CES Agent如何通过授权获取临时AK/SK? Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束
metric Metric object 否 指标信息。 详细参数说明请参见表3。 condition Condition object 否 告警规则设置的告警策略。 详细参数说明请参见表8。 alarm_level Integer 否 告警历史的告警级别。值为1、2、3、4。其中1为紧急,2为重要,3为次要,4为提示。
Eye部署时通过物理区域划分,为项目级服务,需要在各区域(如华北-北京1)对应的项目(cn-north-1)中设置策略,并且该策略仅对此项目生效,如果需要所有区域都生效,则需要在所有项目都设置策略。访问Cloud Eye时,需要先切换至授权区域。 权限根据授权精细程度分为角色和策略。 角色:
安装GPU指标集成插件 通过在GPU加速型Linux实例上安装GPU监控插件,可以为用户提供系统级、主动式、细颗粒度的GPU监控,包含GPU指标收集和GPU系统事件上报。GPU支持监控的指标,参见GPU指标。 本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版GPU监控插件: