检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数”的统计。 告警统计 该数据统计的是近7天状态为“告警中”的告警级别明细和资源分组告警。告警级别明细中包含对“紧急告警”、“重要告警”、“次要告警”和“提示告警”的统计。 关键指标 展示了产品自主推荐的关键指标的监控详情。 在云服务看板详情页面中,单击左上角的选择框,可选择资源
当告警触发后,我们需要定义通知的渠道和对象,快速的将告警信息通过配置的渠道通知到运维人员。 当前CES支持以下三种方式来完成通知的配置。 通知策略(推荐):产品最新上线能力,通过通知策略可以完成告警的分级通知、简易排班。 通知组:通过在云监控服务上配置的通知群组,可以快速通知到指定运维人员。
通过资源分组实现云资源分组监控 对于有一定资源规模的组织或企业而言,资源数量大多会因为人工维护繁琐导致易出错,同时应用于不同生产环节的资源可能需要分组管理,例如用于测试和用于生产的资源相比,需要配置的监控与告警、通知渠道与接收用户也可能不一样。云监控支持根据实例名称、实例标签、企
购买广域网质量监控资源包 资源包是一种预付费的计费方式,帮助您以更优惠的价格享受等量资源,从而减少支出。本文介绍资源包的类型、规格、定价和使用等信息,并指导用户如何购买广域网质量监控资源包。 资源包类型 广域网质量监控当前只支持包月资源包。 表1 资源包类型 类型 说明 适用场景
虚拟私有云为弹性云服务器构建隔离的、用户自主配置和管理的虚拟网络环境,提升用户云中资源的安全性,简化用户的网络部署。 当您的弹性云服务器要访问Internet时,您可使用虚拟私有云创建的弹性公网IP绑定到弹性云服务器上,弹性云服务器即可连接公网。不同弹性公网IP还可以共享带宽,减少您的带宽成本。 使
155天 “亚太-曼谷”的指标数据最长保留周期为一年,聚合周期为24小时。 若需要将数据保存更长时间,可对数据进行转储保存。具体操作请参考数据转储。 如果某个资源实例被停用、关闭或者删除,相应的原始指标数据停止上报1小时后,实例相关的指标就被删除。停用或关闭的实例被重新启用后,指标
指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 字符格式必须以字母开头,只能包含0-9/a-z/A-Z/_-,字符长度最短为1,最大为96。 dim 否 String 监控维度,例如弹性云服务器的维度为in
等指标,详见云产品监控指标。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。 目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 ECS规格建议Linux使用“2vCPUs |
排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Agent上报数据时取的是ECS或BMS的操作系统本地时间,管理控制台下发的请求时间范围是依赖用户客户端浏览器的时间,两者如果不匹配则可能导致管理控制台查不到操作系统监控数据。 修改裸金属服务器和用户客户端浏览器时间一致参考命令:timedatectl
视图。 用户可根据业务需求,拖动其中的监控视图,调整监控视图的顺序。 单击监控视图上方的“近1小时”、“近3小时”、“近12小时”、“近24小时”、“近7天”,可切换该监控看板下的所有视图的监控周期,其中“近1小时”以内的监控时长系统默认显示原始指标数据,其他时长周期默认显示聚合指标数据。
排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Agent上报数据时取的是ECS或BMS的操作系统本地时间,管理控制台下发的请求时间范围是依赖用户客户端浏览器的时间,两者如果不匹配则可能导致管理控制台查不到操作系统监控数据。 修改裸金属服务器和用户客户端浏览器时间一致参考命令:timedatectl
网络无法访问:修改DNS配置或CES的终端节点。 各区域对应的云监控服务的Endpoint请参考“地区和终端节点”。 问题解决(Windows) 以administrator权限用户登录弹性云服务器或裸金属服务器。 进入任务管理器,查看telescope进程是否存在。 当包括图5和图6两个进程时,表示telescope进程正常。
告警通知系统模板更新记录 云监控服务930版本将短信告警通知系统模板中的告警信息进行了修改,具体变更信息如表1 短信-指标系统通知模板、表2 短信-系统事件系统通知模板和表3 短信-自定义事件系统通知模板所示: 表1 短信-指标系统通知模板 信息 变更操作 告警恢复状态 新增 跳转连接
网络无法访问:修改DNS配置或CES的终端节点。 各区域对应的云监控服务的Endpoint请参考“地区和终端节点”。 问题解决(Windows) 以administrator权限用户登录弹性云服务器或裸金属服务器。 进入任务管理器,查看telescope进程是否存在。 当包括图5和图6两个进程时,表示telescope进程正常。
时间范围:可选择查询最近七天内任意时间段的操作事件。 选择完查询条件后,单击“查询”。 在需要查看的记录左侧,单击展开该记录的详细信息,展开记录如图1所示。 图1 展开记录 在需要查看的记录右侧,单击“查看事件”,弹出一个窗口,如图2所示,显示了该操作事件结构的详细信息。 图2 查看事件的详细日志信息 父主题:
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应
场景化实践案例 电商平台业务监控 云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 使用资源分组和告警功能上报指定资源的监控指标 配置云服务器全部挂载点磁盘使用率告警规则
查询Agent的Endpoint配置 执行如下命令,确认DNS解析是否正常。 ping ces.cn-south-1.myhuaweicloud.com 网络正常:排查结束。 网络无法访问:修改DNS配置或CES的终端节点。 各区域对应的云监控服务的Endpoint请参考“地区和终端节点”。
、使用中的数据库连接数等其他监控指标可根据您的实际情况来设置。 建议将弹性公网IP和带宽的出网带宽使用率告警阈值设置为80%,连续三次超过阈值后开始告警。其他监控指标可根据您的实际情况来设置。 单击“立即创建”,完成告警规则的创建。 当业务量飙升,RDS、弹性公网IP和带宽或EL
检查应用和数据库之间的连接是否重新建立了连接。 复制状态异常 即主备之间复制时延太大(一般在写入大量数据,或者执行大事务的时候会出现),在业务低峰期备机会逐渐追上主机。还有另一种可能是主备间的网络中断,导致主备复制异常。但不会导致原来单实例的读写中断,客户的应用是无感知的。 提交工单处理。