检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
正确。 账号欠费。 Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 服务器内部时间和本地标准时间不一致。 Agent插件版本不同,日志路径也不同。 日志路径分别如下: Linux: 新版本Agent:/usr/local/u
查询一键告警关联告警规则列表 功能介绍 查询一键告警关联告警规则列表 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/one
选择需要屏蔽告警的资源。 说明: 单次最多可添加100个资源。 屏蔽方式选择资源屏蔽时,可直接设置选择对象。 屏蔽方式选择策略屏蔽时,需要先设置选择规则和选择策略后,再设置选择对象。可选择全部资源或指定资源。 屏蔽方式选择事件屏蔽,且监控范围选择指定资源时,需要设置选择对象。 选择指标 仅当屏
gent。如果重启后状态还是故障,可能Agent相关文件被破坏,请尝试重新安装Agent,安装方法参考Agent安装说明。 服务器内部时间和本地标准时间不一致。 使用的DNS非华为云DNS,请通过执行dig+目标域名获取到agent.ces.myhuaweicloud.com在华
ECS是电商平台的基础支撑,因此ECS上细微的性能变化,都可能会引起电商业务的大幅震荡,甚至出现宕机,引起巨大损失。 主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为ECS自动上报的监控指标,操作系统监控通过在ECS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。
value Number 告警阈值。 unit String 单位 count Integer 次数,事件告警时参数值为1~180(包括1和180);指标告警和站点告警时,次数采用枚举值,枚举值分别为:1、2、3、4、5、10、15、30、60、90、120、180 suppress_duration
复插件配置”不成功或其他原因导致无法配置Agent,你可以采用本章节提供的手工方式配置Agent。 约束与限制 目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已成功安装Agent插件。 确认正在使用的Agent版本 使用管理员账号,登录ECS。
参数说明 名称 屏蔽规则的名称。 选择对象 选择要屏蔽的对象。 说明: 单次最多可添加100个该服务的资源。 选择策略屏蔽时,需要先选择规则和选择策略后,再选择对象。 选择指标 仅当屏蔽方式为资源屏蔽时,可选择需要屏蔽告警的指标。 说明: 如果不指定指标,则对所有指标生效。 选择规则
监控服务。 表1 常用最佳实践 实践 描述 电商平台 电商平台最佳实践 电商业务对内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。 站点监控功能可对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。
机器。 因硬件故障重启已完成 当收到该事件时,说明该ECS已正常工作,可继续使用。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“事件监控”,在事件监控页面,单击相页面右上角的创建告警规则,根据界面提示配置参数。
获取方式请参见获取项目ID。 请求消息 单次POST请求消息体大小不能超过512KB,否则请求会被服务端拒绝。 对于不同的period取值和查询的指标数量,其对应的默认最大查询区间(to - from)也不同,计算规则为“指标数量 * (to - from) / 监控周期 ≤ 3000”。
表。 格式为service.item;service和item必须是字符串,必须以字母开头,只能包含0-9/a-z/A-Z/_,service.item总长度最短为3,最大为32,其中service不能为“SYS”、“AGT”和“SRE”,namespace不能为SERVICE.
使用事件监控 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控,并在事件发生时进行告警。 事件即云监控保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。
日志监控提供了针对日志内容的实时监控能力。通过云监控服务和云日志服务的结合,用户可以针对日志内容进行监控统计、设置告警规则等操作,降低用户监控日志的运维成本,简化用户使用监控日志的流程。 事件监控: 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源
ion/install/telescope/bin/conf.json 修改文件中的参数,具体参数请参见表1。 认证用的AccessKey和SecretKey明文存储有很大的安全风险, 建议对该区域下所有云服务器或裸金属服务器安装的Agent做委托授权,委托方法请参考如何配置委托?
用户单行数据量过大,可能会导致查询超时,进而节点OOM异常退出等各种故障发生。 1. 对每列和每行的写入长度做限制,遵从规范,使得单行的的key和value长度和不超过阈值。 2. 排查业务是否出现异常写入和异常编码,导致写入大row。 过大的单行记录,随着数据量增长,集群稳定性会下降。 用户计划删除KMS密钥
用户单行数据量过大,可能会导致查询超时,进而节点OOM异常退出等各种故障发生。 1. 对每列和每行的写入长度做限制,遵从规范,使得单行的的key和value长度和不超过阈值。 2. 排查业务是否出现异常写入和异常编码,导致写入大row。 过大的单行记录,随着数据量增长,集群稳定性会下降。 用户计划删除KMS密钥
该资源分组中资源的总个数。 type_statistics Integer 否 该资源分组中选择的资源类型个数。如资源分组添加了弹性云服务、弹性公网IP和带宽则值为2。 表5 meta_data字段数据结构说明 名称 参数类型 是否必选 说明 total Integer 否 结果总条数。 返回样例
-Z/_,长度最短为1,最大为64。 event_source String 否 事件来源,格式为service.item。service和item必须是字符串,必须以字母开头,只能包含0-9/a-z/A-Z/_,总长度最短为3,最大为32。 time Long 是 事件发生时间。UNIX时间戳,单位毫秒。