检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GPU驱动正常安装后,最多10分钟将在控制台看到采集到的GPU指标数据。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法,请参见安装lspci工具。 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
归属企业项目 表1 配置规则信息 参数 参数说明 归属企业项目 资源分组所属的企业项目。只有拥有该企业项目权限的用户才可以查看和管理该资源分组。创建企业项目请参考:创建企业项目。 (可选)配置“高级配置”,关联告警模板,创建新的告警规则。 选择告警模板名称,根据界面提示,配置告警通知参数。
参数说明 名称 是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 样例:查询告警规则配额。 GET https://{云监控的endpoint}/V1.0/{project_id}/quotas 请求消息 无 响应消息 响应参数 表2 响应参数 名称
在弹出的“创建站点监控”对话框中根据界面提示配置参数,如图1所示。 图1 创建站点监控 监控频率建议设置为1分钟,更多参数说明如配置参数所示。 配置完成后,单击“确定”,完成创建站点监控。 单击站点监控所在行右侧“操作”列下的“创建告警规则”。 在创建告警规则界面,按照界面提示配置参数,参数说明请参见配置参数。 响
在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置告警规则名称。 图4 配置告警规则名称 选择监控对象,配置告警触发条件。 图5 配置告警规则 配置“分组”参数时,选择在操作步骤1-创建资源分组中创建的“开发组资源”。 根据界面提示,配置告警通知参数。 图6 配置告警通知 注意,配置“通知对
在弹出的“创建站点监控”对话框中根据界面提示配置参数,如图1所示。 图1 创建站点监控 配置完成后,单击“确定”,完成创建站点监控。 创建站点监控完成后,单击站点名称右侧的“ 创建告警规则”,为设置的站点配置告警规则。 在创建告警规则界面,按照界面提示配置参数,参数说明请参见配置参数。 建议针对可用性
在“创建告警规则”界面,根据界面提示配置参数。 监控对象为当前的ECS,无需配置。 选择监控指标,选择“自定义创建”,参照配置参数说明完成参数配置。 以CPU使用率为例,由于需要给服务器预留部分处理性能保障服务器正常运行,所以建议将CPU告警阈值设置为80%,连续三次超过阈值后开始报警。 配置完成后,单击“立即创建”,完成创建告警规则。
告警条件时,支持以邮箱、短信、HTTP、HTTPS等方式通知用户,让用户在第一时间得知云服务发生异常,迅速处理故障,避免因资源问题造成业务损失。 配置云服务器全部挂载点告警规则 配置云服务器全部挂载点磁盘使用率告警规则 云监控服务提供了配置云服务器全部挂载点告警规则的能力。磁盘使
为了更加安全高效的使用云监控服务提供的主机监控功能,我们提供了最新方式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Agent做临时AK/SK授权,并且以后在该区域新创建的资
制作的私有镜像不可跨Region使用,因为跨Region使用私有镜像创建的ECS实例无法取得监控数据。 前提条件 已有安装Agent的ECS实例。 操作步骤 进入ECS控制台的实例管理页面,单击该实例右侧的“更多 > 关机”,将已安装Agent的ECS实例关机,如图1所示。 图1 关机 单击该实例右侧的“更多 > 镜像/磁盘/备份
云监控插件(Agent) Agent安装配置方式说明 Agent版本特性 Agent安装说明 安装配置Agent 管理Agent 其他插件安装说明 升级Agent 父主题: 主机监控
第六十四次正式发布: 新增BMS硬件监控插件说明章节。 下线安装GPU ECC监控插件(Linux)章节。 2023-08-21 第六十三次正式发布: 更新Agent版本特性章节。 优化Agent安装说明章节。 下线一键配置插件说明章节。 下线安装GPU指标与RAID指标采集插件采集插件(Linux)章节。
HTTP状态码 429 错误码 ces.0429 可能原因 原因1:API被流控。详见下方【案例一】 解决方法 若API被流控,需第一时间找运维人员配置新的流程策略。 案例一 API被流控 查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30
主机监控 如何配置DNS和安全组? 如何配置委托? CES Agent如何通过授权获取临时AK/SK? Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束
告警 告警规则在何种情况下会触发“数据不足”? 带宽的监控数据没有超限记录但是收到了告警通知 为什么配置了5分钟聚合指标告警规则,实际却无法触发告警? 为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警? 父主题: 故障排查
ces:metricData:list √ × 查询指定时间范围指定事件类型的主机配置数据,可以通过参数指定需要查询的数据维度(该接口提供给HANA场景下SAP Monitor查询主机配置数据,其他场景下查不到主机配置数据)。 GET /V1.0/{project_id}/event-data
部分云服务的资源查询权限,如在使用中遇到权限问题,需要配置涉及服务的细粒度授权特性,才可以正常使用,支持细粒度授权的云服务列表请参考: 使用IAM授权的云服务。 告警通知:依赖SMN服务的SMN FullAccess。 配置数据转储:依赖OBS服务的OBS OperateAccess。
优势:配置简单,一键式打开开关。 弹性云服务器、弹性公网IP和关系型数据库的重要事件。 事件监控 指标监控 立即触发 普通告警 根据设置的告警策略触发告警。例如:CPU利用率在5分钟内的平均值连续5次>=80%时发送告警通知。 优势:告警策略更加灵活,可根据业务情况灵活配置。 所有支持监控的服务。
Agent插件上线墨西哥城一、圣保罗一和圣地亚哥区域。 商用 Agent安装配置方式说明 2 上线Agent插件的一键安装能力,支持上海一和北京一区域。 您能够通过以下方式,非常方便地安装云服务器监控Agent插件: 1、在云服务器购买流程页面,选择云服务器创建后自动安装监控插件。 2、在云监控服务->主机监控
这里以平时的SNAT连接数为10000为例,高峰期为平时的2-3倍,因此配置SNAT连接数为30000的告警规则。 出网带宽使用率建议配置为80%。 “告警通知”功能触发产生的告警消息由消息通知服务SMN发送,可能产生少量费用,具体费用请参考产品价格说明。 配置完成后,单击“立即创建”,完成创建告警规则。