检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机资源作为最重要的云上资源,如何做好对它的监控、告警,在实际的运维过程中尤为重要。可以借助云监控快速构建主机监控能力,通过在华为云公共镜像主机(ECS实例)中安装Agent插件,在主机监控以可视化的方式查看其监控数据,以及对重点业务指标进行配置监控告警,及时准确掌握主机资源的云上运行状态
分别单击弹性公网IP和带宽与NAT网关所在行的“创建告警规则”。 这里以平时的SNAT连接数为10000为例,高峰期为平时的2-3倍,因此配置SNAT连接数为30000的告警规则。 出网带宽使用率建议配置为80%。 “告警通知”功能触发产生的告警消息由消息通知服务SMN发送,可能产生少量费用,具体费用请参考产品价格说明。
云监控服务会自动开通。同时您可以很方便使用云监控服务管理控制台或API接口查看云服务运行状态并设置告警规则。 实时可靠 原始采样数据实时上报,提供对云服务的实时监控,实时触发产生告警并通知用户。 监控可视化 云监控服务通过监控面板为用户提供丰富的图表展现形式,支持数据自动刷新以及指
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
com/package/install_amd64.exe 操作步骤 使用具有“管理员”权限的账号(例如,administrator)登录Windows弹性云服务器。 在浏览器地址栏输入表3中的下载路径,下载并保存安装包。 进入安装包存放目录。 根据安装包的格式选择相应的操作方式进行插件安装。 若安装包为zip格式
终端节点 终端节点(Endpoint)即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 父主题: 使用前必读
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
聚合是指云监控服务在一定周期内对原始采样指标数据进行最大、最小、平均、求和或方差值的计算,并把结果汇总的过程。这个计算周期又叫聚合周期。 聚合是一个平滑的计算过程,聚合周期越长、平滑处理越多,用户对趋势的预测越准确;聚合周期越短,聚合后的数据对告警越准确。 云监控服务的聚合周期目前最小是5分钟,同时还有20分钟、1小时、4小时、1天,共5种聚合周期。
监控大盘简介 监控大盘是根据一些重点云服务的资源水位使用情况、核心业务指标的推荐,内置的默认监控看板。用户仅需简单的开启大盘即可创建完成重点服务的看板视图,方便可视化观测云上资源的各类核心重点指标数据。 监控大盘适用于对重点云服务资源有整体资源监控使用情况观测的场景。若您想要快速对整体资源进
Agent插件状态显示“已停止”该如何处理? 查看Agent版本 使用root账号,登录ECS。 执行如下命令,确认使用Agent的版本。 if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope
afka中。当您需要通过分布式消息服务Kafka的控制台或使用开源Kafka客户端查询云服务的监控指标时,可以使用云监控服务提供的数据转储功能。 在CES上配置转储监控数据时,选择的“转储目标”资源类型支持转储到其他租户账号购买的kafka。 一个账户最多创建20个数据转储任务。
业务端口被Agent占用该如何处理? 云监控服务的Agent插件会使用HTTP请求上报数据,使用过程中会随机占用动态端口,范围取自/proc/sys/net/ipv4/ip_local_port_range。若发现使用的业务端口与Agent使用的端口冲突,可以修改/proc/sys/ne
通知组 需要发送告警通知的通知组。创建通知组请参见创建通知对象/通知组。 通知对象 需要发送告警通知的对象,可选择“云账号联系人”或主题。 云账号联系人:注册时的手机和邮箱。 主题:消息发布或客户端订阅通知的特定事件类型,若此处没有需要的主题,需先创建主题并订阅该主题,详细操作请参见创建主题、添加订阅。
批量修改开启状态的一键告警关联告警规则的告警通知 功能介绍 批量修改开启状态的一键告警关联告警规则的告警通知 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI PUT
事件监控 在实际的业务的运行中,ECS、BMS可随时根据业务调整,进行删除、重启、关闭、删除网卡、删除安全组等操作。因此,可以使用事件监控随时监控ECS、BMS的运行状态。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页
购买广域网质量监控资源包 资源包是一种预付费的计费方式,帮助您以更优惠的价格享受等量资源,从而减少支出。本文介绍资源包的类型、规格、定价和使用等信息,并指导用户如何购买广域网质量监控资源包。 资源包类型 广域网质量监控当前只支持包月资源包。 表1 资源包类型 类型 说明 适用场景
置负载均衡ELB网络流出速率的80%作为告警阈值。 建议将RDS的CPU使用率告警阈值设置为80%,连续三次超过阈值后开始告警。磁盘使用率、IOPS、使用中的数据库连接数等其他监控指标可根据您的实际情况来设置。 建议将弹性公网IP和带宽的出网带宽使用率告警阈值设置为80%,连续三
站点监控 大量的商品类目、用户信息、交易数量、店铺展示信息,会导致不同用户访问网站速度变慢。可使用站点监控对网站的可用性进行监控,并且对类目、用户、交易、店铺等接口进行持续拨测,测试接口的可用性,判断业务系统是否正常。 本章节以www.example.com为例,创建站点监控,并
VMTools,云监控服务无法提供监控弹性云服务器的内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个指标。但可以监控带外网络流入速率和带外网络流出速率指标,这样导致CPU使用率指标的精确性可能会降低。 弹性云服务器支持的监控指标,请参见弹性云服务器支持的监控指标。 父主题: 主机监控
应对大规模资源的监控 应用场景 对于有一定资源规模的组织或企业而言,资源数量大多会因为人工维护繁琐导致易出错,同时应用于不同生产环节的资源可能需要分组管理,例如用于测试和用于生产的资源相比,需要配置的监控与告警、通知渠道与接收用户也可能不一样。云监控支持根据实例名称、实例标签、企