检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看主机监控的监控指标 本章节指导用户查看主机监控指标,监控指标分为Agent插件采集的细颗粒度的操作系统级别监控指标和ECS自带的监控指标。 操作系统监控指标和基础监控指标请参见云产品监控指标。 前提条件 已完成Agent插件的安装。安装请参考Agent安装说明进行安装。 操作步骤
Agent如何通过授权获取临时AK/SK? Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束 BMS硬件监控指标采集说明 什么是插件修复配置?
创建实例失败产生的事件,一般是磁盘个数,配额大小都很小,底层资源耗尽导致。 检查磁盘个数、配额大小,释放资源后重新创建。 实例全量备份失败 单次全量备份失败产生的事件,不影响以前成功备份的文件,但会对“时间点恢复”的功能有一些影响,导致“时间点恢复”时增量备份的恢复时间延长。 重新发起一次手工备份。 主备切换异常
单击页面左侧的“资源分组”,进入“资源分组”页面。 单击页面右上角的“创建资源分组”按钮。 图1 创建资源分组 按照界面提示,填写分组名称。 选择需要添加的云服务资源。 图2 选择云服务资源 单击“立即创建”,完成资源分组的创建。 创建完成后,可在资源分组界面查看分组的资源使用情况、告警情况、健康情况等。
本章节指导用户如何让新购买的ECS实例带有操作系统监控功能。 制作的私有镜像不可跨Region使用,因为跨Region使用私有镜像创建的ECS实例无法取得监控数据。 前提条件 已有安装Agent的ECS实例。 操作步骤 进入ECS控制台的实例管理页面,单击该实例右侧的“更多 > 关机”,
操作系统监控GPU页面显示无记录该如何处理? 在查看主机监控的监控指标时,如果出现操作系统监控GPU页面显示无记录的问题,请先确认您的机器是否支持GPU。若您的机器支持GPU且驱动运行正常,请参考以下操作步骤升级插件为增强版: 卸载当前基础版Agent: Linux平台:登录机器执行命令
数据聚合方式,支持的聚合方式如下: average:聚合周期内指标数据的平均值。 max:聚合周期内指标数据的最大值。 min:聚合周期内指标数据的最小值。 sum:聚合周期内指标数据的求和值。 variance:聚合周期内指标数据的方差。 filter参数的值不会影响原始数据(period为1)的查询结果。
3和ECS-04)。现在需要通过告警通知功能,及时获取开发组下的两台弹性云服务器的资源运行状态(包含CPU利用率、CPU空闲时间占比、平均负载、I/O使用率、磁盘使用率、内存使用率、inode已使用占比),而测试组下的两台弹性云服务器不需要获取其运行状态。 表1 云服务器列表和分组规划
站点监控 大量的商品类目、用户信息、交易数量、店铺展示信息,会导致不同用户访问网站速度变慢。可使用站点监控对网站的可用性进行监控,并且对类目、用户、交易、店铺等接口进行持续拨测,测试接口的可用性,判断业务系统是否正常。 本章节以www.example.com为例,创建站点监控,并
概览 无论您使用的是ECS还是BMS,都可以使用主机监控来采集丰富的操作系统层面监控指标,也可以使用主机监控进行服务器资源使用情况监控和排查故障时的监控数据查询。 主机监控分为基础监控、操作系统监控和进程监控。 基础监控:ECS自动上报的监控指标,数据采集频率为5分钟1次。可以监
当告警触发后,我们需要定义通知的渠道和对象,快速的将告警信息通过配置的渠道通知到运维人员。 当前CES支持以下三种方式来完成通知的配置。 通知策略(推荐):产品最新上线能力,通过通知策略可以完成告警的分级通知、简易排班。 通知组:通过在云监控服务上配置的通知群组,可以快速通知到指定运维人员。
云监控服务”。 单击页面左侧的“云服务监控 > 弹性公网IP和带宽”,单击具体带宽或弹性IP所在行的“创建告警规则”。 建议针对业务所涉及的弹性公网IP、带宽配置告警规则,出网带宽使用率,阈值设置为“原始值”“≥”购买带宽的90%。 根据界面提示配置名称、描述和告警规则和告警通知参数。
关联模板:当同一个云产品下多组资源需要配置相同的告警规则时,使用告警模板可省去手动重复配置的过程。 模板 当触发规则选择关联模板时,需要选择导入的模板。 您可以选择系统预置的默认告警模板,或者选择自定义模板。 事件名称 用户操作资源的动作,如用户登录,用户登出,为一个瞬间的操作动作。 事件监控支持的操作事件请参见事件监控支持的事件说明。
是 创建的资源分组选择一个或者多个资源。 详细参数说明请参见表3。 表3 resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。
云监控服务支持的聚合方法有哪些? 云监控服务支持的聚合方法有以下五种: 平均值 聚合周期内指标数据的平均值。 最大值 聚合周期内指标数据的最大值。 最小值 聚合周期内指标数据的最小值。 求和值 聚合周期内指标数据的求和值。 方差 聚合周期内指标数据的方差。 聚合运算的过程是将一个聚
分别单击弹性公网IP和带宽与NAT网关所在行的“创建告警规则”。 这里以平时的SNAT连接数为10000为例,高峰期为平时的2-3倍,因此配置SNAT连接数为30000的告警规则。 出网带宽使用率建议配置为80%。 “告警通知”功能触发产生的告警消息由消息通知服务SMN发送,可能产生少量费用,具体费用请参考产品价格说明。
当主机挂载磁盘数量较多时,Agent占用的CPU或内存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。 可选:执行以下命令,切换至Agent安装路径的bin下。
“拉美-圣地亚哥”区域位于智利。 资源的价格 不同区域的资源价格可能有差异,请参见华为云服务价格详情。 如何选择可用区? 是否将资源放在同一可用区内,主要取决于您对容灾能力和网络时延的要求。 如果您的应用需要较高的容灾能力,建议您将资源部署在同一区域的不同可用区内。 如果您的应用要求实例之间的网络延时较低,则建议您将资源创建在同一可用区内。
云审计服务支持的Cloud Eye操作列表 表1 云审计服务支持的Cloud Eye操作列表 操作名称 资源类型 事件名称 创建告警规则 alarm_rule createAlarmRule 删除告警规则 alarm_rule deleteAlarmRule 停用告警规则 alarm_rule
快速入门 概述 本节通过调用一系列云监控的API为ECS的cpu_util指标创建告警规则,当指标的数值达到设置的阈值时及时通知用户处理。 通过IAM服务获取到的Token有效期为24小时,需要使用同一个Token鉴权时,可以先将Token缓存,避免频繁调用。 操作步骤 Token认证,具体操作请参考认证鉴权。