检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在监控视图右上角,单击,进入监控项详情页面。您可以选择系统提供的固定时长或自定义时间段来查看云服务的监控周期内的走势图。 在监控项详情页面,其中“近1小时”、“近3小时”、“近12小时”、“近24小时”以内的监控时长系统默认显示原始指标数据,“近7天”及以上的监控时长系统默认显示聚合指标数据。不同监控周
指标数据保留多长时间? 指标数据分为原始指标数据和聚合指标数据。 原始指标数据是指原始采样指标数据,原始指标数据一般保留2天。 聚合指标数据是指将原始指标数据经过聚合处理后的指标数据,聚合指标数据保留时间根据聚合周期不同而不同,通过API获取的聚合指标数据保留时间如下: 表1 聚合指标数据保留时间
不同用户访问网站速度变慢。可使用站点监控对网站的可用性进行监控,并且对类目、用户、交易、店铺等接口进行持续拨测,测试接口的可用性,判断业务系统是否正常。 本章节以www.example.com为例,创建站点监控,并为站点的可用性、响应时间、丢包率创建告警规则,当发生异常时通知用户及时处理。
扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性,并且使用云监控的事件监控功能对服务器运行异常及自动恢复进行监控,订阅事件告警同步进行业务处理。 表1 ECS重点事件 事件名称 事件说明 处理步骤 因硬件故障触发重启 弹性云服务器所在的主机出现故障时,系统会自动将
修改DNS与添加安全组(Linux) 操作场景 本章节指导用户为Linux系统的ECS或BMS添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,BMS操作步骤类似。 修改ECS的DNS配置有两种方式:命令
主机监控Agent对主机的性能会有影响吗? 主机监控Agent占用的系统资源很小,性能基本不会受到影响。 在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装Agent资源占用情况如下:
搭建业务的系统级监控。 本文介绍云监控服务常用最佳实践,帮助您更好的使用云监控服务。 表1 常用最佳实践 实践 描述 电商平台 电商平台最佳实践 电商业务对内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。
从主机监控列表页“名称/ID”单击资源或者“查看监控指标”进入主机监控指标详情页。 图7 查看监控指标 图8 操作系统监控 进入指标详情页展示操作系统监控和基础监控,操作系统监控下展示的指标就是安装了Agent之后会展示出来的指标,如果操作系统监控为空,可以安装Agent成功之后再进行查看。 配置主机告警 在主机监控
本Agent) 问题现象 Agent一键修复后运行正常,但仍然没有监控数据。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时AK/SK失败 网络问题 首先需要确认使用的Agent版本。
我的配额”。 系统进入“服务配额”页面。 图1 我的配额 您可以在“服务配额”页面,查看各项资源的总配额及使用情况。 如果当前配额不能满足业务要求,请参考后续操作,申请扩大配额。 如何申请扩大配额? 登录管理控制台。 在页面右上角,选择“资源 > 我的配额”。 系统进入“服务配额”页面。
动态阈值:指告警触发阈值是根据智能计算指标的历史数据预测指标的阈值,若实际值偏离预测值,则触发告警。 静态阈值 事件类型 当告警类型选择事件时,需要选择事件类型,可选择系统事件或自定义事件。 系统事件 事件来源 当告警类型选择事件时,需要设置事件来源。 当事件类型选择系统事件时,需要选择事件来源的云服务名称。
选择“FunctionGraph函数”,选择对应的函数和函数版本。 选择“FunctionGraph”,选择对应的工作流。 选择“钉钉”,需要在钉钉的群设置中选择“智能群助手”,添加机器人时选择“自定义”,创建完成后即可获得webhook地址。 例如: https://qyapi.weixin.qq.co
监控插件实现硬件的故障风险检查时,仅会采集一些必要的系统指标用作巡检,详情见硬件监控指标采集说明。 仅支持部分Linux操作系统,详情见:Agent支持的系统有哪些?。 支持的规格:所有规格的BMS。 若实例使用自建的私有镜像作为操作系统,请确保其包含了如下软件:dmidecode、l
Agent插件资源占用和熔断说明 资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保
资源分组添加资源方式,取值只能为EPS(同步企业项目),TAG(标签动态匹配),Manual(手动添加),不传代表查询所有资源分组类型,COMB(智能添加-组合匹配) 枚举值: EPS TAG Manual COMB origin_flag 否 String 来源标识,取值只能为resourcegroup(资源分组)
事件类型,值为EVENT.SYS或EVENT.CUSTOM。EVENT.SYS表示系统事件,EVENT.CUSTOM表示自定义事件。 event_source String 否 事件名称,值为系统产生的事件名称,或用户自定义上报的事件名称。 event_level String 否
式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Agent做临时AK/SK授权,并且以后在该区域新创建的资源都会自动获得此授权。本节针对本授权做以下说明:
Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束 BMS硬件监控指标采集说明 什么是插件修复配置? 怎样让新购ECS实例中带有操作系统监控功能?
该资源ID需保证全局唯一性,即同一个RegionID下Agent使用的InstanceId不能相同,否则系统可能会出现异常。 InstanceId必须与实际的ECS或BMS资源ID一致,否则云监控服务界面将看不到对应ECS或BMS资源操作系统监控的数据。 ProjectId ProjectId可不用配置,保持"ProjectId":
查询指标列表 功能介绍 查询系统当前可监控指标列表,可以指定指标命名空间、指标名称、维度、排序方式,起始记录和最大记录条数过滤查询结果。 云服务资源删除后,会保留3个小时的数据缓存,在3小时之内还能查到资源对应的监控指标,属于正常现象。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API