检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
CES服务接入Prometheus。 通过使用cloudeye-exporter,可以将CES服务与本地的Prometheus系统对接,继而使用Prometheus系统对云上资源的性能数据进行监控运维。 商用 Prometheus如何监控华为云所有服务 2 新增分布式消息服务 DMS的监控指标。
start 若报障则说明已卸载Agent或者相关文件已被删除,请重新安装Agent。 Agent状态显示“已停止”(老版本) 请执行以下命令来启动Agent: service telescoped start 若报障则说明已卸载Agent或者相关文件已被删除,请重新安装Agent。 父主题:
安全 责任共担 身份认证与访问控制 审计与日志 数据保护技术
事件监控 事件监控简介 查看事件监控数据 创建事件监控的告警通知 事件监控支持的事件说明
接入Prometheus/Grafana 安装配置CES Exporter 将监控数据导出到自建Prometheus/Grafana 父主题: 接入中心
了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。 您可以使用本文档提供的API对指标、告警规则、监控数据进行相关操作,如查询指标列表、查询告警规则列表、创建告警规则、删除告警规则等。支持的全部操作请参见API概览。 在调用云监控服务API之前
况、核心业务指标的推荐,内置的默认监控看板。用户仅需简单的开启大盘即可创建完成重点服务的看板视图,方便可视化观测云上资源的各类核心重点指标数据。 监控大盘适用于对重点云服务资源有整体资源监控使用情况观测的场景。若您想要快速对整体资源进行视图创建,同时不清楚配置哪些指标时,推荐使用监控大盘功能。
事件监控最佳实践 弹性云服务器事件 关系型数据库事件 弹性公网IP事件 父主题: 场景化实践案例
告警通知 告警通知系统模板更新记录 创建通知对象/通知组 创建/修改/删除通知策略 修改通知对象/通知组 删除通知对象/通知组 创建/删除/复制/修改通知内容模板 创建告警通知主题 父主题: 告警
当前创建的Linux云服务器,均不支持内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标。但Windows云服务器是支持这四个指标的。 不同操作系统支持的基础监控指标情况请参考弹性云服务器监控指标支持列表。 如需要监控内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率,请安装主机监控Agent。
1代表指标的原始周期,比如RDS监控指标原始周期是60s,表示该RDS指标按60s周期为一个数据点参与告警计算;如想了解各个云服务的指标原始周期可以参考“支持服务列表”,300代表指标按5分钟聚合周期为一个数据点参与告警计算。 最小值:0 最大值:86400 枚举值: 0 1 300 1200
要的告警,为减少这类告警对运维的干扰,可以通过告警屏蔽进行处理,以便更好的关注真正重要的告警。 用户可屏蔽某个资源或某个资源下的告警策略、系统事件。 父主题: 告警屏蔽
企业项目的子用户无法看到一键告警功能 企业项目的子用户在配置告警规则时,无法选择全部资源 告警通知是什么,分为几类? 告警状态有哪些? 告警级别有哪些? 如何查看数据盘的磁盘使用率和创建告警通知? 如何修改告警通知中云账号联系人和主题订阅者的电话、邮箱等信息? 如何将告警通知发送给子账号?
通知配置模块如下图所示。 通知策略模块如下图所示。 监控最核心的职责是帮助用户发现问题,而问题的发现是依赖监控系统中对告警规则的配置,告警规则配置的覆盖率、准确率将直接影响监控系统的故障发现率。 父主题: 告警配置方式
incorrect. 使用正确的分页信息 403 ces.0009 不允许添加系统指标 Adding SYS metric is not allowed 使用正确权限添加指标数据 403 ces.0010 不允许删除系统指标 Deleting SYS metric is not allowed
"period": 300, //告警周期(必填,整数) "filter": "average", //数据聚合方式(必填,String) "comparison_operator": ">=", //告警阈值的比较条件(必填,String)
单次可创建告警规则条数 1000 说明: 若选择监控对象为50个,监控指标为20个,则可创建的告警规则条数为1000。 发送通知可选择主题数 5 单次导出监控数据条数 400 说明: 若监控对象为400个,则监控指标为1个。若监控对象为80个,则监控指标为5个。 可创建资源分组个数 1000 单个资源分组单次添加资源数
1代表指标的原始周期,比如RDS监控指标原始周期是60s,表示该RDS指标按60s周期为一个数据点参与告警计算;如想了解各个云服务的指标原始周期可以参考“支持服务列表”,300代表指标按5分钟聚合周期为一个数据点参与告警计算。 枚举值: 0 1 300 1200 3600 14400 86400
每小时返回缓慢状态次数)/ 每小时探测的总次数 * 100%。 packet_loss_rate 丢包率 丢包率是数据包丢失部分与所传数据包总数的比值。 http_code HTTP响应码 HTTP响应码代表服务端反馈的响应状态,即标准的HTTP状态码。是用3位数字表示网页服务器超文本传输协议响应的状态
502 Bad Gateway 请求未完成。服务器从上游服务器收到一个无效的响应。 503 Service Unavailable 请求未完成。系统暂时异常。 504 Gateway Timeout 网关超时。 父主题: 公共参数