检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
当告警触发后,我们需要定义通知的渠道和对象,快速的将告警信息通过配置的渠道通知到运维人员。 当前CES支持以下三种方式来完成通知的配置。 通知策略(推荐):产品最新上线能力,通过通知策略可以完成告警的分级通知、简易排班。 通知组:通过在云监控服务上配置的通知群组,可以快速通知到指定运维人员。 主题订阅:通
单击页面左侧的“主机监控 > 弹性云服务器”或“主机监控 > 裸金属服务器”,进入主机监控页面。 单击ECS或BMS主机所在栏右侧的“更多”按钮,选择下拉出的“创建告警规则”。 在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置告警规则基本信息。 表1 主机监控告警规则基本信息配置说明 参数
资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
查询指标列表 功能介绍 查询系统当前可监控指标列表,可以指定指标命名空间、指标名称、维度、排序方式,起始记录和最大记录条数过滤查询结果。 云服务资源删除后,会保留3个小时的数据缓存,在3小时之内还能查到资源对应的监控指标,属于正常现象。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
故障监控能力。 物理机硬件监控插件只针对BMS实例生效,其他云服务器不受其影响。 BMS实例缺失硬件监控插件会导致华为云无法第一时间感知实例的硬件故障,可能影响业务可用性时长,且故障需要用户主动联系技术支持处理。 当安装硬件监控插件后,硬件故障风险会以事件的方式主动通知到用户,需要用户及时授权对风险硬件的维修或更换。
标。 弹性云服务器-云服务器 资源层级 当告警类型选择指标时,需选择告警规则的资源层级,可选择云产品或子维度,推荐选择云产品。 以弹性云服务器ECS为例:用户购买了云产品(ECS虚拟机),根据指标划分了多个子维度(包含磁盘、挂载点、进程等)。 云产品 监控范围 告警规则适用的资源
创建自定义告警模板选择的资源类型,即服务命名空间,如选择弹性云服务器,则命名空间为SYS.ECS。 须知: 当选择的资源类型为“弹性云服务器中操作系统监控”,命名空间必须为SYS.ECS。 dimension_name 是 String 资源类型对应的指标监控维度,选择弹性云服务器,则维度为云服务器,dimensio
资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
namespace String 否 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 dname String 否 自定义告警模板选择的资源维度,例如弹性云服务器维度为instance_id。各服务的监控维度可查看支持监控的服务列表。
Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 安装配置Agent成功,需要等待2分钟,管理控制台上才会有操作系统监控数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Ag
使用具有“管理员”权限的账号(例如,administrator)登录Windows弹性云服务器。 根据Agent安装路径判断当前Agent版本,方法参见Windows平台。 卸载当前版本的Agent,卸载命令参见卸载Agent。 安装最新版本的Agent,安装命令参见Windows系统。 父主题: 云监控插件(Agent)
} 示例3:授权用户拥有告警规则所有操作权限(告警规则的创建,修改,查询,删除)。 一个自定义策略中可以包含多个授权项,且除了可以包含本服务的授权项外,还可以包含其他服务的授权项,可以包含的其他服务必须跟本服务同属性,即都是项目级服务或都是全局级服务。多个授权语句策略描述如下: {
String 创建自定义告警模板选择的资源类型,即服务命名空间,如选择弹性云服务器,则命名空间为SYS.ECS。 dimension_name 是 String 资源类型对应的指标监控维度,选择弹性云服务器,则维度为云服务器,dimension_name值为instance_id。 template_items
事件发生时间。UNIX时间戳,单位毫秒。 说明:因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 detail Detail object 是 事件详情。
配置告警规则的基本信息。 表1 事件监控的告警规则基本信息配置说明 参数 参数说明 名称 系统会随机产生一个名称,用户也可以进行修改。 描述 告警规则描述(此参数非必填项)。 选择监控对象,配置告警内容参数。 图1 配置事件监控的告警内容 表2 事件监控告警内容参数说明 参数 参数说明
云监控Console页面查看您的云产品运行状态和相关指标数据,并对监控项创建告警规则。 主机监控 通过监控ECS或BMS的CPU使用率、内存使用率、磁盘等基础指标,确保ECS或BMS的正常使用,避免因为对资源的过度使用造成业务无法正常运行。 处理异常场景 云监控服务会根据您创建的
指标数据保留多长时间? 指标数据分为原始指标数据和聚合指标数据。 原始指标数据是指原始采样指标数据,原始指标数据一般保留2天。 聚合指标数据是指将原始指标数据经过聚合处理后的指标数据,聚合指标数据保留时间根据聚合周期不同而不同,通过API获取的聚合指标数据保留时间如下: 表1 聚合指标数据保留时间
企业项目的子用户在监控概览页面可以查看到主账号资源信息 云监控服务的概览页面暂未支持按企业项目分权分域维度的查询功能,敬请期待。 父主题: 云服务监控
主机id 正则匹配:^[a-zA-Z0-9-]{1,64}$ instance_type 否 String 主机类型,ECS弹性云服务器,BMS裸金属服务器 枚举值: ECS BMS invocation_id 否 String 任务id 正则匹配:^([0-9A-Za-z]){1}([0-9A-Za-z]|_|-)*$
中各服务监控指标中取值范围,如支持监控的服务列表中ECS的CPU使用率cpu_util取值范围可配置80。[具体阈值取值请参见附录中各服务监控指标中取值范围,如支持监控的服务列表中ECS的CPU使用率cpu_util取值范围可配置80。](tag: dt,g42,dt_test,hk_g42