检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
不支持局点:华南-广州-友好用户环境、拉美-圣保罗一、拉美-墨西哥城一。 操作步骤 使用具有“管理员”权限的账号(例如,administrator)登录Windows弹性云服务器。 根据Agent安装路径判断当前Agent版本,方法参见Windows平台。 卸载当前版本的Agent,卸载命令参见卸载Agent。
告警 告警简介 告警规则 告警记录 告警模板 告警通知 应用示例:用户自定义创建弹性云服务器CPU利用率告警 一键告警 告警屏蔽
to 是 String 查询数据截止时间UNIX时间戳,单位毫秒。from必须小于to。 dim 是 String 监控维度,例如弹性云服务器的维度为instance_id。各服务监控指标对应的维度请参考支持监控的服务列表中对应服务的监控指标说明。 指标的维度,目前最大支持3
电商平台业务监控 云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 使用资源分组和告警功能上报指定资源的监控指标 配置云服务器全部挂载点磁盘使用率告警规则
主机id 正则匹配:^[a-zA-Z0-9-]{1,64}$ instance_type 否 String 主机类型,ECS弹性云服务器,BMS裸金属服务器 枚举值: ECS BMS invocation_id 否 String 任务id 正则匹配:^([0-9A-Za-z]){1}([0-9A-Za-z]|_|-)*$
子维度两种类型,推见您使用云产品层级,两者介绍如下。 云产品(推荐):该方式将允许您在同一告警规则内配置多个维度的指标,如CPU使用率(云服务器维度)、磁盘使用率(挂载点维度)。 子维度:该方式只允许您在同一告警规则内配置单个维度的指标,2024年之前的产品能力,不推荐使用。 监控范围(监控对象)
time Long 是 事件发生时间。UNIX时间戳,单位毫秒。 说明:因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 detail Detail object
修订记录 发布日期 修改记录 2021-06-16 配置云服务器全部挂载点磁盘使用率告警规则上线。 2020-03-09 使用资源分组和告警功能最佳实践上线。 2019-03-06 事件监控最佳实践上线。 2019-01-22 云监控在众包平台中的应用上线。 2018-09-30
BMS硬件监控指标采集说明 以下是BMS硬件监控插件对应的监控指标采集说明。 指标分类 指标说明 采集方式 服务器整机信息 服务器整机SN、产品名称、厂家等。 使用dmidecode命令采集。 SSD/HDD 基本信息和SMART信息 包含盘的基本信息。(SN、型号、容量、协议类型、固件版本等),以及盘的SMART
检查配置是否正确。 账号欠费。 Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 服务器内部时间和本地标准时间不一致。 Agent插件版本不同,日志路径也不同。 日志路径分别如下: Linux: 新版本Agent:/usr/l
bel,如ECS实例会增加hostname、ip等label,同时支持将华为云标签转化为label,满足对资源自定义label的诉求,具体如下表所示。 表1 拓展标签支持情况 云服务 命名空间 是否支持拓展标签 标签数据来源 弹性云服务器 SYS.ECS/AGT.ECS √ 配置审计或弹性云服务器
法参考管理Agent。如果重启后状态还是故障,可能Agent相关文件被破坏,请尝试重新安装Agent,安装方法参考Agent安装说明。 服务器内部时间和本地标准时间不一致。 使用的DNS非华为云DNS,请通过执行dig+目标域名获取到agent.ces.myhuaweicloud
原因1:API被流控。详见下方【案例一】 解决方法 若API被流控,需第一时间找运维人员配置新的流程策略。 案例一 API被流控 查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30 20:00:00到2019-04-30
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
资源数(告警中/已触发/资源总数) 组内所有正在告警的资源数/已触发告警的资源数/组内所有资源的数量。 资源类型数 组内资源类型的数量,例如组内有2台弹性云服务器 、1个云硬盘两种资源类型,则资源类型数为2。 归属企业项目 拥有资源分组权限的企业项目名称。 创建方式 创建资源分组的方式,有手动添加和智能添加两种。
取值范围:只能由中文、英文字母、数字、下划线、中划线组成。长度范围:1-128个字符。 取值样例:dataShareJob-ECSMetric 资源类型 云监控服务监控的资源类型。 取值样例:弹性云服务器。 维度 监控对象的范围。 各服务监控对象的维度值请参考监控指标说明页面的“监控指标”和“维度”表格中描述。
Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。
Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。
String 创建告警规则时选择的资源分组名称,如:Resource-Group-ECS-01 表4 dimensions字段数据结构说明 名称 参数类型 说明 name String 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。
Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。