检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
当通知方式选择通知策略时,需要选择发送告警通知的策略。 通知组 当通知方式选择通知组时,需要选择发送告警通知的通知组。创建通知组请参见创建通知对象/通知组。 通知对象 当通知方式选择主题订阅时,需要选择发送告警通知的对象,可选择联系人或主题。 联系人:注册时的手机和邮箱。 主题:消息发布或客户端订阅通知的特定事件类
连接各业务与数据库的各个基础接口。BMS与ECS的运行状态对整体业务至关重要,CPU、内存、磁盘使用率等会直接影响整体业务状态,因此,需使用主机监控和事件监控随时监控ECS与BMS的运行状况。 网站与各个基础接口的可用性、响应时间、丢包率等会直接影响用户使用的流畅程度,需使用站点监控随时监控各站点的运行情况。
告警通知”,进入告警通知界面。 在告警通知界面,选择“通知模板”页签。 若仅删除单个通知模板,单击待删除的通知模板所在行“操作”列的“删除”;若批量删除多个通知模板,可勾选多个通知模板后,单击列表上方的“删除”。 图3 删除通知模板 单击“确定”,即可删除该通知模板。 复制通知模板 登录管理控制台。
图4 查询Agent的Endpoint配置 执行如下命令,确认DNS解析是否正常。 ping ces.cn-south-1.myhuaweicloud.com 网络正常:排查结束。 网络无法访问:修改DNS配置或CES的终端节点。 各区域对应的云监控服务的Endpoint请参考“地区和终端节点”。
网络性能监控 广域网质量监控中探测点的分布有哪些? 父主题: 产品使用
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
云监控在众包平台中的应用 简介 站点监控 主机监控 网络监控 事件监控 父主题: 场景化实践案例
日志监控提供了针对日志内容的实时监控能力。通过云监控服务和云日志服务的结合,用户可以针对日志内容进行监控统计、设置告警规则等操作,降低用户监控日志的运维成本,简化用户使用监控日志的流程。 事件监控: 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件
场景化实践案例 电商平台业务监控 云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 使用资源分组和告警功能上报指定资源的监控指标 配置云服务器全部挂载点磁盘使用率告警规则
修改prometheus中的prometheus.yml文件配置。如下配置所示在scrape_configs下新增job_name名为“huaweicloud”的节点。其中targets中配置的是访问cloudeye-exporter服务的ip地址和端口号,services配置的是你想要监控的服务,比如SYS
使用资源分组和告警功能最佳实践上线。 2019-03-06 事件监控最佳实践上线。 2019-01-22 云监控在众包平台中的应用上线。 2018-09-30 云监控在视频直播中的应用上线。 2018-07-30 电商平台业务监控上线。
告警通知系统模板更新记录 云监控服务930版本将短信告警通知系统模板中的告警信息进行了修改,具体变更信息如表1 短信-指标系统通知模板、表2 短信-系统事件系统通知模板和表3 短信-自定义事件系统通知模板所示: 表1 短信-指标系统通知模板 信息 变更操作 告警恢复状态 新增 跳转连接
告警级别分为紧急,重要,次要,提示四种级别,其中告警规则的告警级别由用户设置,用户可根据自己业务及告警规则设置合理告警级别,四种级别简单说明如下: 紧急告警:告警规则对应资源发生紧急故障,影响业务视为紧急告警。 重要告警:告警规则对应资源存在影响业务的问题,此问题相对较严重,有可能会阻碍资源的正常使用。 次要告警:
资源分组支持的云服务 云服务 英文简称 产品 手动添加 企业项目 标签 实例名称 组合匹配 弹性云服务器 ECS 云服务器 √ √ √ √ √ 裸金属服务器 BMS 云服务器 √ √ √ √ √ API网关专享版 APIC APIG实例 √ √ √ √ √ API网关 APIG 接口
快速入门 概述 本节通过调用一系列云监控的API为ECS的cpu_util指标创建告警规则,当指标的数值达到设置的阈值时及时通知用户处理。 通过IAM服务获取到的Token有效期为24小时,需要使用同一个Token鉴权时,可以先将Token缓存,避免频繁调用。 操作步骤 Token认证,具体操作请参考认证鉴权。
合成一个点,所以导致查询出来的指标数据量少于上报的数据量。 原因2:若上报指标周期与批量查询监控数据的监控周期相同,根据上面计算规则,最多返回的指标数据量为3000。 解决方法 将请求参数监控周期按照接口文档给出的枚举值选择小点的监控周期。 使用查询监控数据接口查询指标数据(仅支
历史告警保存时间 7天 单次创建告警规则可选择的被监控对象数 5000 单次可创建告警规则条数 1000 说明: 若选择监控对象为50个,监控指标为20个,则可创建的告警规则条数为1000。 发送通知可选择主题数 5 单次导出监控数据条数 400 说明: 若监控对象为400个,则监控指
电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口,双12、618等大型购物节
指定告警规则对应的策略总数 最小值:0 最大值:100 表5 ListPolicy 参数 参数类型 描述 metric_name String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_
调用不同region区域的接口,对应的域名是什么。 解决方法 参考文档:地区和终端节点。 常见4XX问题处理 HTTP状态码 429 错误码 ces.0429 可能原因 原因1:API被流控。详见下方【案例一】 解决方法 若API被流控,需第一时间找运维人员配置新的流程策略。 案例一 API被流控