检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
什么是聚合? 聚合是指云监控服务在一定周期内对原始采样指标数据进行最大、最小、平均、求和或方差值的计算,并把结果汇总的过程。这个计算周期又叫聚合周期。 聚合是一个平滑的计算过程,聚合周期越长、平滑处理越多,用户对趋势的预测越准确;聚合周期越短,聚合后的数据对告警越准确。 云监控服
一键式告警和普通告警的主要差异点如表1所示。 表1 一键告警和告警对比一览表 告警类型 主要目标 范围 告警对象 告警触发方式 一键告警 当重要事件发生时,立即触发告警通知。 优势:配置简单,一键式打开开关。 弹性云服务器、弹性公网IP和关系型数据库的重要事件。 事件监控 指标监控
43200, 86400;0表示只告警一次,300表示每5分钟告警一次,600表示每10分钟告警一次,900表示每15分钟告警一次,1800表示每30分钟告警一次,3600表示每1小时告警一次,10800表示每3小时告警一次,21600表示每6小时告警一次,43200表示每12小时告警一次,86400表示每1天告警一次。
在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置告警规则基本信息。 表1 主机监控告警规则基本信息配置说明 参数 参数说明 名称 系统会随机产生一个名称,用户也可以进行修改。 描述 告警规则描述(此参数非必填项)。 选择监控对象,配置告警内容参数。 表2 主机监控告警内容配置说明 参数 参数说明 取值样例
参考信息 目前通过消息通知服务推送的告警内容格式是固定的,不支持自定义JSON格式的告警内容。相关告警字段如表5所示。 以下表格中的告警字段为通用字段,若存在特殊字段,请联系技术支持。 表5 告警字段 参数 说明 message_type 取值为alarm。 alarm_id 告警规则ID。
TOP5进程不固定,进程列表中展示的是近24小时内按一分钟统计周期进入过TOP5的进程。 只有近24小时内进入过TOP5的进程并开启了监控开关的进程才会采集CPU使用率、内存使用率和打开文件数。如满足上述条件的进程已被关闭时,则不会展示此进程的相关数据。 列表中的时间表示该进程创建的时间。
{query-string} 尽管请求URI包含在请求消息头中,但大多数语言或框架都要求您从请求消息中单独传递它,所以在此单独强调。 表1 URI中的参数说明 参数 描述 URI-scheme 表示用于传输请求的协议,当前所有API均采用HTTPS协议。 Endpoint 指定承载REST服务端点的服务器
需要配置涉及服务的细粒度授权特性,才可以正常使用,支持细粒度授权的云服务列表请参考: 使用IAM授权的云服务。 表2列出了云监控服务常用操作与系统权限的授权关系,您可以参照该表选择合适的系统权限。 表2 常用操作与系统权限的关系 功能 操作 CES FullAccessPolicy
在管理控制台左上角选择区域和项目。 选择“服务列表 > 计算 > 弹性云服务器”。 弹性云服务器列表中,单击ECS名称查看详情。 在“虚拟私有云”项单击虚拟私有云名称。如图2所示。 进入“虚拟私有云”界面。 图2 虚拟私有云 在“虚拟私有云”列表中,单击子网个数。 在“子网”列表中,单击子网名称。 进入子网详情页面。
功能时,将按照实际使用量进行计费。 广域网质量监控目前在公测阶段,如需开通,请提交工单申请公测。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“网络性能监控 > 广域网质量监控”。 单击“立即开通”。 在“开通广域网质量监控”页面,可查看计费模式和计费说明。
装Agent。 安装完成Agent,可以在主机监控列表页进行查看,“插件状态”列显示“运行中”状态的即为插件安装成功。 图6 插件状态 步骤二:查看主机监控指标 登录管理控制台 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控 > 弹性云服务器”,进入主机监控页面。
服务可能产生额外费用,具体由提供该功能的服务结算。 通常情况下,云监控服务产生的增值服务费用很低,因此建议您根据需要搭配使用。 增值服务列表如下: 监控数据文件转储:需要使用对象存储服务(OBS),转储后的监控数据文件将永久保存。 发送告警通知:需要使用消息通知服务(SMN),当
约束与限制 当前云监控服务对单个用户的使用限制如表1所示。调整配额请参考配额调整。 表1 用户资源限制 配额类型 默认限制 可创建告警规则数 1000 可创建自定义告警模板数 200 告警模板可添加告警规则数 50 可创建监控看板数 10 单监控看板可添加监控视图数 50 历史告警保存时间
已安装Agent插件,具体安装步骤请参见安装配置Agent。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入主机监控页面。 单击ECS主机所在栏右侧的“更多”按钮,选择下拉出的“创建告警规则”。
在ECS详情页,单击安全组页签。 进入安全组列表页。 单击具体的安全组名。 单击“更改安全组规则”。 进入安全组详情页。 BMS的操作步骤: 请单击表格中左上角的安全组ID。 在对应安全组“操作”列单击“配置规则”。 在“出方向规则”页签下单击“添加规则”。 按表1所示添加规则。 表1 安全组规则 协议 端口
指标名称 指标说明 单位 支持版本 采集方式 GPU指标 gpu_status 虚拟机上GPU健康状态。该指标是一个综合指标,0代表健康,1代表亚健康,2代表故障。 - 2.4.5 Linux: 通过调用GPU卡的libnvidia-ml.so.1库文件获取 Windows: 通过调用GPU卡的nvml
源的告警规则的功能。告警模板关联资源分组后将生成相应告警规则,告警规则中的策略会随模板同步修改。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“告警 > 告警模板”,进入告警模板界面。 单击“自定义告警模板”页签。 在“自定义告警模板”界面,单击告警模板所在行的“关联到分组”。
探测点的响应时间,方便用户了解站点整体性能,及时处理异常情况。 目标站点可用性以小时为周期进行统计,开通监控后,1小时后可查看可用性监控图表。 可用性 =(每小时探测的总次数 - 每小时返回异常状态次数)/ 每小时探测的总次数 * 100%
0、86400。0表示只告警一次,300表示每5分钟告警一次,600表示每10分钟告警一次,900表示每15分钟告警一次,1800表示每30分钟告警一次,3600表示每1小时告警一次,10800表示每3小时告警一次,21600表示每6小时告警一次,43200表示每12小时告警一次,86400表示每1天告警一次。
agent"; else echo 0; fi 返回“old agent”,表示使用老版本Agent,请参考老版本操作指令。 返回版本号,表示使用新版本Agent,请参考新版本操作指令。 返回“0”,表示未安装Agent。 查看Agent状态(新版本) 以root用户登录主机,执行以下命令,查看Agent状态。