检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
导入导出自定义告警/事件模板 如果您想通过已有的自定义告警/事件模板快速创建告警/事件模板,可以先导出目标模板,再导入告警/事件模板。本章节指导用户如何导入导出自定义告警/事件模板。 导入自定义告警模板 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“告警 > 告警模板”,进入告警模板界面。
返回版本号,表示使用新版本Agent。 返回“0”,表示未安装Agent。 问题分析 一键式修复插件失败后的排查思路: 检查DNS配置。 检查IAM委托配额。 查看用户权限。 解决方法 检查DNS配置是否正确。 登录管理控制台。 单击“计算 > 弹性云服务器”。 单击弹性云服务器名称。
没有做编码识别。针对此问题有以下解决方案: 使用记事本等文本编译器直接打开,或使用WPS打开; 打开csv文件时,对Excel进行如下设置: 新建Excel。 选择“数据 > 自文本”。 选择导出的监控数据csv文件,单击“导入”。 进入“文本导入向导”。 选择“分隔符号”,单击“下一步”。
such file or directory”,导致Agent安装失败,如图1所示。 图1 Agent安装失败 问题分析 CES Agent低版本无法适配部分ARM镜像,导致您安装Agent的过程中出现该错误。 解决方案 执行以下命令,卸载已安装的Agent: bash /usr/
当有数据返回时,表示获取AK/SK正常。排查结束。 调用失败或者回显如下时,请执行5。 图2 获取AK/SK失败 在管理控制台的云监控服务页面,选择“主机监控 > 弹性云服务器”,选择对应的目标云服务器并单击“修复插件配置”。 问题解决,排查结束。 未解决,请执行6。 执行如下命令,检查路由: route
ta 批量查询监控数据接口如何使用。 解决方法 请参考批量查询监控数据解决。 问题二 问题描述 POST /V1.0/{project_id}/batch-query-metric-data 批量查询监控数据接口支持的最大查询时间范围。 解决方法 支持的最大查询时间:155天。 问题三
推荐用户使用CES提供的模板,CES提供的模板涉及企业项目概念,请完成第2步中,Prometheus配置文件中请求企业项目的配置,导入步骤如下所示: 选择“+ > Import”,如下图所示。 图4 导入 输入json模板文件,单击“load”。 图5 加载json模板 模板文件获取地址: 云搜索服务 CSS
资源分组 一套完整的电商平台会使用到ECS、CDN、AS、安全服务、RDS、OBS、VPC等服务,您可以创建资源分组,将电商业务的ECS、EIP、EVS等资源划分成一个分组,通过资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规则,可以极大的降低运维复杂度,提高运维效率。
图3 查询cesagency委托 图4 配置权限 问题解决,排查结束。 未解决,请执行6。 执行如下命令,确认DNS解析是否正常。 ping agent.ces.myhuaweicloud.com 网络正常:排查结束。 网络无法访问:修改DNS配置或CES的终端节点。 各区域对应的
添加监控数据 功能介绍 添加一条或多条自定义指标监控数据,解决系统监控指标不能满足具体业务需求的场景。 监控数据保留时间请参见《云监控服务用户指南》的“指标数据保留多长时间”章节。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以
弹性云服务器,修改模板中弹性云服务器策略,会自动同步到告警规则中,修改弹性云服务器-磁盘策略,则不会自动同步。 自定义创建 模板 选择需要导入的模板。当触发规则选择“关联模板”时,需配置该参数。 您可以选择系统预置的默认告警模板,或者选择自定义模板。 - 告警策略 触发告警规则的告警策略。
手动恢复告警记录 手动恢复是指用户在控制台上通过人工干预来确认问题已经被解决,并将该告警状态改为“已解决(手动)”。此操作存在风险,只用于特殊场景,一般不建议做手动恢复。本章节指导用户如何手动恢复告警记录。 约束与限制 告警状态为告警中、已触发或数据不足时,可手动恢复告警记录。 操作步骤
关联模板:当同一个云产品下多组资源需要配置相同的告警规则时,使用告警模板可省去手动重复配置的过程。 模板 当触发规则选择关联模板时,需要选择导入的模板。 您可以选择系统预置的默认告警模板,或者选择自定义模板。 事件名称 用户操作资源的动作,如用户登录,用户登出,为一个瞬间的操作动作。
告警状态有哪些? 目前云监控服务支持六种告警状态: 告警中、已解决、数据不足、已触发、已失效、已解决(手动)。 告警中:监控指标数值达到告警配置阈值,资源正在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致;
0/{project_id}/metric-data 查询监控数据接口如何使用。 解决方法 参考查询监控数据接口文档:查询监控数据。 问题二 问题描述 调用不同region区域的接口,对应的域名是什么。 解决方法 参考文档:地区和终端节点。 常见4XX问题处理 HTTP状态码 429 错误码
通过设置监控数据文件前缀可以方便您区分OBS桶中的云监控服务数据文件与其他普通文件。 ecs-0615 选中的桶会将读写策略授权给云监控服务,请谨慎修改桶策略,防止转储失败。 为了确保安全,选择已有的桶时请选择“存储类型”为标准存储,并且“桶策略”为私有的桶。 如果配置的转储策略处于关闭状态七天以上,会默认被清除。若用户需要使用,需重新配置策略。
业务端口与Agent使用的端口冲突,可以修改/proc/sys/net/ipv4/ip_local_port_range,并重启Agent解决此问题。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为:
RDS重点事件 事件名称 事件说明 处理步骤 创建实例业务失败 创建实例失败产生的事件,一般是磁盘个数,配额大小都很小,底层资源耗尽导致。 检查磁盘个数、配额大小,释放资源后重新创建。 实例全量备份失败 单次全量备份失败产生的事件,不影响以前成功备份的文件,但会对“时间点恢复”的
全量备份失败 GaussDBV5FullBackupFailed 重要 一般是备份文件导出失败或上传失败等原因导致。 提交工单让运维处理。 无法备份数据。 差量备份失败 GaussDBV5DifferentialBackupFailed 重要 一般是备份文件导出失败或上传失败等原因导致。
在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。 电商业务主要涉及ECS、CDN、AS、安全服务、RDS、ELB、OBS等服务。通过资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规则,可以极大的降低运维复杂度,提高运维效率。