检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
障,避免因资源问题造成业务损失。 配置云服务器全部挂载点告警规则 配置云服务器全部挂载点磁盘使用率告警规则 云监控服务提供了配置云服务器全部挂载点告警规则的能力。磁盘使用率指标调整为挂载点维度,在新配置磁盘使用率告警规则时需要选择“云服务器挂载点”维度。
配额类型 默认限制 可创建告警规则数 1000 可创建自定义告警模板数 200 告警模板可添加告警规则数 50 可创建监控看板数 10 单监控看板可添加监控视图数 50 历史告警保存时间 7天 单次创建告警规则可选择的被监控对象数 5000 单次可创建告警规则条数 1000 说明:
对于EVS相关指标数据,disk_name维度下,它的返回值有云服务器实例ID-盘符名和云服务器实例ID-volume-卷ID两种。 云服务器实例ID-盘符名,例如:6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d-vda(vda为盘符名)。 云服务器实例ID-volume-卷ID,例
在“自定义监控”页面,可以查看当前用户通过API请求上报至云监控服务的相关数据,包括自定义上报的服务,指标等。 当用户通过API添加监控数据后,云监控服务界面才会显示自定义监控数据。添加监控数据请参见添加监控数据。 选择待查看的云服务资源所在行的“查看监控指标”,进入“监控指标”页面。 在这个页面,用户可
资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 from 否 查询告警历史的起始时间。UNIX时间戳,单位毫秒,如:1602501480905。from、to如果不进行赋值,则默认to是当前时间,from是当前时间减7天的时间戳。
2、Pi1、P1。 暂不支持CCE纳管后的GPU加速型实例。 前提条件 已安装GPU驱动,未安装lspci工具的云服务器影响GPU掉卡事件的上报。 如果您的弹性云服务器未安装GPU驱动,请参见GPU驱动概述安装GPU驱动。 安装GPU驱动需使用默认路径。 GPU驱动安装完后,需重
进入监控大屏模式:单击某个看板页面上方的“监控大屏”。 退出监控大屏模式:按快捷键Esc即可退出全屏模式。 图2 进入监控大屏模式 按自定义时间范围查看监控指标 监控指标可快捷选择显示“近1小时”、“近3小时”、“近12小时”、“近24小时”、“近7天”的数据,如果您想要看近2小时或者某自定义时间范围的指标时可以使用拖动选择自定义时间范围功能。
原因2:指标对应的维度错误。详见下方【案例二】 原因3:ECS实例未安装agent插件。详见下方【案例三】 原因4:ECS实例安装的agent插件没有上报磁盘使用率指标数据。详见下方【案例四】 案例一 命名空间错误 命名空间错误。若查询的是弹性云服务器中操作系统监控指标,命名空间需为AGT.ECS。 请求参数: {
Cloud Eye自定义策略 如果系统预置的云监控服务权限,不满足您的授权要求,可以创建自定义策略。自定义策略中可以添加的授权项(Action)请参考《CES API参考》中“策略及授权项说明” 章节。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了
登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 选择“云服务监控”。 分别单击弹性公网IP和带宽与NAT网关所在行的“创建告警规则”。 这里以平时的SNAT连接数为10000为例,高峰期为平时的2-3倍,因此配置SNAT连接数为30000的告警规则。
告警一次、每1天告警一次。 说明: 当触发类型为累计触发时,该参数可选。 每5分钟告警一次 配置事件类告警策略示例 例如,事件名称为开机失败 、触发时间周期为在5分钟内,触发类型为累计触发 、触发次数为2、告警频率为每5分钟告警一次。 表示:在5分钟内,某台云服务器开始失败事件累计触发2次则每5分钟触发告警一次。
图。 在监控项详情页面,其中“近1小时”、“近3小时”、“近12小时”、“近24小时”以内的监控时长系统默认显示原始指标数据,“近7天”、“近30天”以内的监控时长系统默认显示聚合指标数据。 进入监控视图详情后,您可以按自定义时间段查看监控指标或选择监控对象查看监控指标。 图1 查看监控视图详情
账号 用户注册时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用用户进行日常管理工作。 用户 由账号在IAM中创建的用户,是云服务的使用人员,具有身份凭证(密码和访问密钥)。
origin 否 String Agent任务接口调用源,CES表示由Console调用,APICOM_BMS表示由裸金属服务器调用,ADMIN_SERVER表示由运维平台调用 枚举值: CES APICOM_BMS ADMIN_SERVER version 否 String 版本号 最小长度:0
String 创建告警规则时选择的资源分组名称,如:Resource-Group-ECS-01 表4 dimensions字段数据结构说明 名称 参数类型 说明 name String 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。
部署在ECS上,Web-Server主要提供网站的搜索、类目、店铺、交易等业务,API-Server为连接各业务与数据库的各个基础接口。BMS与ECS的运行状态对整体业务至关重要,CPU、内存、磁盘使用率等会直接影响整体业务状态,因此,需使用主机监控和事件监控随时监控ECS与BMS的运行状况。
据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Agent上报数据时取的是ECS或BMS的操作系统本地时间,管理控制台下发的请求时间范围是依赖用户客户端浏览器的时间,两者如果不匹配则可能导致管理控制台查不到操作系统监控数据。 修改裸金属服务器和用户客户端浏览
事件监控最佳实践 弹性云服务器事件 关系型数据库事件 弹性公网IP事件 父主题: 场景化实践案例
time 是 Long 事件发生时间。UNIX时间戳,单位毫秒。 说明: 因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 例如,当前时间为2020.01.30
告警 告警简介 告警规则 告警记录 告警模板 告警通知 应用示例:用户自定义创建弹性云服务器CPU利用率告警 一键告警 告警屏蔽