检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控配置监控及告警的全流程介绍 主机资源作为最重要的云上资源,如何做好对它的监控、告警,在实际的运维过程中尤为重要,本文主要介绍主机如何进行监控及配置告警。 应用场景 当用户购买了主机资源后,对于资源的运行状态需要进行必要的监控,以及对重点业务指标进行配置监控告警,能及时准确掌握主机资源的云上运行状态。
Agent各种状态说明及异常状态处理方法 插件有以下四种状态: 运行中:插件正常运行,监控数据上报正常。 未安装: Agent未安装,安装方法参考《云监控服务用户指南》中的“Agent安装说明”章节。 Agent已经安装,委托未配置,委托配置方法参考如何配置委托?。 Agent已
警规则”。 这里以平时的SNAT连接数为10000为例,高峰期为平时的2-3倍,因此配置SNAT连接数为30000的告警规则。 出网带宽使用率建议配置为80%。 “告警通知”功能触发产生的告警消息由消息通知服务SMN发送,可能产生少量费用,具体费用请参考产品价格说明。 配置完成后,单击“立即创建”,完成创建告警规则。
可能存在建立新连接失败。一般是由于数据库/数据库代理压力过大,或代理与数据库间网络异常 观察数据库与数据库代理压力指标后(连接数、活跃连接数、CPU使用率)调整相应参数,压力指标正常情况下提工单处理 通过代理访问的业务流量中断 数据库代理与数据库只读库连通性异常 proxy_co
云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 使用资源分组和告警功能上报指定资源的监控指标 配置云服务器全部挂载点磁盘使用率告警规则
企业项目的子用户在配置告警规则时,无法选择全部资源 告警通知是什么,分为几类? 告警状态有哪些? 告警级别有哪些? 如何查看数据盘的磁盘使用率和创建告警通知? 如何修改告警通知中云账号联系人和主题订阅者的电话、邮箱等信息? 如何将告警通知发送给子账号?
} 案例四 指标ID不属于云服务 rds958_disk_util指标ID不属于RDS云服务。 请求参数: { "metrics": [{ "dimensions": [{ "name": "rds_cluster_sqlserver_id", "value":
要通过告警通知功能,及时获取开发组下的两台弹性云服务器的资源运行状态(包含CPU利用率、CPU空闲时间占比、平均负载、I/O使用率、磁盘使用率、内存使用率、inode已使用占比),而测试组下的两台弹性云服务器不需要获取其运行状态。 表1 云服务器列表和分组规划 云服务器名称 分组
包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。 extra_info
修订记录 发布日期 修改记录 2021-06-16 配置云服务器全部挂载点磁盘使用率告警规则上线。 2020-03-09 使用资源分组和告警功能最佳实践上线。 2019-03-06 事件监控最佳实践上线。 2019-01-22 云监控在众包平台中的应用上线。 2018-09-30
两种类型,推见您使用云产品层级,两者介绍如下。 云产品(推荐):该方式将允许您在同一告警规则内配置多个维度的指标,如CPU使用率(云服务器维度)、磁盘使用率(挂载点维度)。 子维度:该方式只允许您在同一告警规则内配置单个维度的指标,2024年之前的产品能力,不推荐使用。 监控范围(监控对象)
memory_second_threshold 第二阈值(内存),默认值为734003200(700MB),单位为Byte。 aAgent的CPU使用率和内存使用率查询方法: Linux: top -p telescope的PID Windows: 在任务管理器中查看Agent进程详情。 {
资源分组简介 资源分组支持用户从业务角度集中管理其业务涉及到的弹性云服务器、云硬盘、弹性IP、带宽、数据库等资源。从而按业务来管理不同类型的资源、告警规则、告警记录,可以迅速提升运维效率。 资源分组支持企业项目,当选择了资源分组到某个企业项目时,只有拥有该企业项目权限的用户才可以查看和管理该资源分组。
创建一个名称为alarm-lxy-rg-RDS,告警类型为资源分组指标告警,每24小时告警一次、告警级别重要的告警规则。 { "name" : "alarm-lxy-rg-RDS", "description" : "", "namespace" : "SYS.RDS", "type"
站点监控概览等。通过查看监控概览,让您实时了解各云服务的资源使用情况和告警情况。 资源总览 资源总览展示您当前账户下弹性云服务器,关系型数据库、弹性公网IP和带宽、云硬盘、对象存储服务等云服务资源总数以及告警数,方便您快速了解云服务资源的运行情况。 告警统计 告警统计提供最近7日告警趋势图、当前不同等级告警条数统计。
包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。 extra_info
创建资源分组(V1) 功能介绍 创建资源分组。资源分组支持将各类资源按照业务集中进行分组管理,可以从分组角度查看监控与告警信息以提升运维效率。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
查询资源分组下的资源 功能介绍 根据资源分组ID查询资源分组下的资源。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /V1.0/{project_id}/
流程策略。 案例一 API被流控 查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30 20:00:00到2019-04-30 22:00:00时间内,周期为20分钟的监控数据。 GET https://{云监控的endpoint}/V1
创建资源分组 使用场景 针对使用多种云产品的用户,通过资源分组功能将同一业务相关的弹性云服务器、裸金属服务器、云硬盘、弹性IP、带宽、数据库等资源添加到同一资源分组中。从分组角度查管理资源,管理告警规则,可以极大的降低运维复杂度,提高运维效率。 限制与约束 一个用户最多可创建1000个资源分组。