检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
监控维度,例如弹性云服务器的维度为instance_id。各服务监控指标对应的维度请参考支持监控的服务列表中对应服务的监控指标说明。 指标的维度,目前最大支持3个维度,维度编号从0开始;维度格式为dim.{i}=key,value。key的最大长度32,value的最大长度为256。 例如dim
Agent插件状态显示“已停止”该如何处理? 查看Agent版本 使用root账号,登录ECS。 执行如下命令,确认使用Agent的版本。 if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope
查看是否有CESAgentAutoConfigAgency的委托。 如果没有且配额已满,请删除不需要的配额后再次进行Agent一键修复。 检查用户权限。 登录管理控制台。 单击“服务列表 > 统一身份认证服务”。 在左侧导航树选择“用户组”。 单击账号所属用户组“操作”列下的“权限配置”。 Agent安装需要有以下权限:
创建自定义告警/事件模板 您可以选择云服务监控提供的默认模板,也可以根据需要自定义添加告警指标完成自定义告警模板的添加。本章节介绍如何创建自定义告警/事件模板。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“告警 > 告警模板”,进入告警模板界面。 在“告警模板”界面,单击“创建自定义模板”。
图4 查询Agent的Endpoint配置 执行如下命令,确认DNS解析是否正常。 ping ces.cn-south-1.myhuaweicloud.com 网络正常:排查结束。 网络无法访问:修改DNS配置或CES的终端节点。 各区域对应的云监控服务的Endpoint请参考“地区和终端节点”。
批量删除告警规则资源 功能介绍 批量删除告警规则资源(资源分组类型的告警规则不支持),资源分组类型的修改请使用资源分组管理相关接口 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
为了更好监控弹性负载均衡服务,需要先开启负载均衡ELB的健康检查,详情参见健康检查异常如何排查?,建议设置负载均衡ELB网络流出速率的80%作为告警阈值。 建议将RDS的CPU使用率告警阈值设置为80%,连续三次超过阈值后开始告警。磁盘使用率、IOPS、使用中的数据库连接数等其他监控指标可根据您的实际情况来设置。
取值样例:widget-axaj 归属企业项目 监控视图关联的企业项目,只有有企业项目的权限,才有权查看此监控视图的监控数据。 资源类型 所关注指标对应的服务名称。 取值样例:弹性云服务器 维度 所关注指标的维度名称。 取值样例:云服务器 监控对象 所关注指标对应的监控对象,数量上限为50个。 可支持一次勾选多个监控对象。
消息通知服务界面创建一个主题并为这个主题添加相关的订阅者,然后在添加告警规则的时候,您需要开启消息通知服务并选择创建的主题,这样在云服务发生异常时,云监控服务可以实时的将告警信息以广播的方式通知这些订阅者。 在没有创建告警通知主题的情况下,告警会发送到账号默认邮箱。 告警规则支持
当安装硬件监控插件后,硬件故障风险会以事件的方式主动通知到用户,需要用户及时授权对风险硬件的维修或更换。 监控插件实现硬件的故障风险检查时,仅会采集一些必要的系统指标用作巡检,详情见硬件监控指标采集说明。 仅支持部分Linux操作系统,详情见:Agent支持的系统有哪些?。 支持的规格:所有规格的BMS。 若
现聚合数据点不连续。例如:聚合周期为5分钟,发送周期为7分钟,则5分钟情况的聚合数据会出现每10分钟才出现一个点。 POST请求体中时间戳(collect_time)的值必须从当前时间的前三天到当前时间后的十分钟之内某一时间,如果不在这个范围内,则不允许插入指标数据。 请求参数 表2
Agent支持的系统有哪些?。 支持的GPU加速型规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1。 暂不支持CCE纳管后的GPU加速型实例。 前提条件 已安装GPU驱动,未安装lspci工具的云服务器影响GPU掉卡事件的上报。 如果您的弹性云服务器未安
将实时监控数据接入自建Prometheus 部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件
指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 字符格式必须以字母开头,只能包含0-9/a-z/A-Z/_-,字符长度最短为1,最大为96。 dim 否 String 监控维度,例如弹性云服务器的维度为in
事件内容,最大长度4096。 group_id 否 String 所属分组。 资源分组对应的ID,必须是已存在的分组ID。 分组ID查询方法: 登录管理控制台。 单击“云监控服务”。 单击页面左侧的“资源分组”。 在名称/ID列获取具体资源分组ID。 resource_id 否 String
等指标,详见云产品监控指标。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。 目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 ECS规格建议Linux使用“2vCPUs |
在告警记录页面,可查看近7天触发的告警的信息。 单击操作列的“手动恢复”。 弹出确定手动恢复的对话框。 图1 手动恢复 单击“确定”,确定手动恢复。 当资源仍处于告警状态时,不建议执行手动恢复,此时如果执行手动恢复,则告警将在下一个告警频率时段内触发。 例如配置的告警频率为每1天告警一次
包)的方式提前购买使用额度和时长。 由于云监控服务需要高频次的访问转储事件文件的OBS桶,因此必须选择标准存储类型的OBS桶,具体价格请参考产品价格说明。 消息通知服务(SMN) 消息通知服务会从短信、邮件、HTTP、HTTPS的使用中收费,具体价格请参考产品价格说明。
ping agent.ces.myhuaweicloud.com 网络正常:排查结束。 网络无法访问:修改DNS配置或CES的终端节点。 各区域对应的云监控服务的Endpoint请参考“地区和终端节点”。 问题解决(Windows) 以administrator权限用户登录弹性云服务器或裸金属服务器。
方便您查看当前弹性云服务器的CPU使用情况。 单击不同CPU利用率的弹性云服务器,可跳转到基础监控图表页面。 查看主机监控数据需购买弹性云服务器,请参见自定义购买弹性云服务器。 网络监控 网络监控展示当前弹性公网IP和带宽的出网带宽与入网带宽最近1小时的网络速率,方便您了解网络使用情况。