检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
管理CCE集群的ICAgent插件 AOM支持对您已购买的CCE(云容器引擎)集群下的主机批量执行ICAgent插件安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。
如何处理界面“ICAgent状态”为“离线”的问题? ICAgent安装完成后,界面“ICAgent状态”为“离线”。 问题分析 原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决方法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查AK/SK配置是否正确。
检查内网域名配置 由于上述配置中的数据上报是通过内网进行数据传输,因此需要确保您的Prometheus所在的主机能够解析内网域名,请参考配置内网DNS。 重新启动Prometheus。 可通过通过grafana查看AOM中的指标数据中grafana查询指标数据的方法,来验证上述配置修改后数据上报是否成功。
仪表盘监控 AOM仪表盘监控概述 创建AOM仪表盘 创建AOM仪表盘(新版) 设置AOM仪表盘全屏模式在线时长 设置AOM仪表盘过滤器 可观测大屏监控 统计图表说明 统计图表说明(新版)
管理CCE集群的ICAgent插件 AOM支持对您已购买的CCE(云容器引擎)集群下的主机批量执行ICAgent插件安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。
OM资源的访问范围。例如您的员工中有负责软件开发的人员,您希望人员拥有AOM的使用权限,但是不希望其拥有删除应用发现规则等高危操作的权限,那么您可以使用IAM为开发人员创建用户,通过授予仅能使用应用发现规则,但是不允许删除应用发现规则的权限策略,控制其对应用发现规则资源的使用范围。
件监控”的主操作界面。 在“实例列表”页签,可查看该组件所有实例的概况。 单击实例名称,可监控业务进程或组件pod的资源占用与健康状态。 在“主机列表”页签,可查看该组件所在的主机概况。 在“告警分析”页签,可查看该组件的告警情况。 单击“监控视图”页签,可监控该组件的各种指标。
在搜索框中输入AccessCode的ID,单击后显示匹配对象。 删除AccessCode 单击“操作”列的“删除”,删除创建的AccessCode。 删除AccessCode,可能会影响API的调用,请谨慎操作。 刷新AccessCode 单击,可实时获取到AccessCode的最新信息。 父主题:
不能废弃以aom_prom_fixed作为前缀的指标 问题描述 在Prometheus实例详情页面的“指标管理”中不能废弃以aom_prom_fixed_作为前缀的指标,且该指标上报到AOM时会收费。 原因分析 当用户使用普罗函数(例如:"count"、"max"、"min"、"
read_recent: true 将复制的Remote Read Prometheus配置代码添加到对应用户自建Prometheus的prometheus.yml文件中。 重启用户自建的Prometheus服务。 即可在用户侧的自建Prometheus中查看AOM的Prometheus数据。 Remote
如何处理界面“ICAgent状态”为“离线”的问题? ICAgent安装完成后,界面“ICAgent状态”为“离线”。 问题分析 原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决办法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查AK/SK配置是否正确。
编辑作业后,作业的执行方案未更新 编辑作业后不会自动同步更新该作业的执行方案。 解决方法 编辑作业后,该作业的执行方案不会自动更新,需要用户重新创建该作业的执行方案。创建执行方案的详细操作请参考作业管理。 父主题: 运维管理(即将下线)
设置搜索条件搜索要查看的组件。 单击组件名称,进入“组件详情”页面。 在“实例列表”页签,可查看该组件所有实例的概况。单击实例名称,可查看进程的监控视图与告警信息。 在“主机列表”页签,可查看该组件所在的主机概况。 在“监控视图”页签下,选择对应的Prometheus实例,可查看该组件的资源使用
Query参数 参数 是否必选 参数类型 描述 action 是 String 对当前节点的操作:失败重试,失败跳过,暂停继续。 restart可重新执行失败的节点,skip可跳过失败的节点进入下个节点的执行,continue可通过暂停节点进入下一个节点。 最小长度:1 最大长度:10 枚举值:
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
正常状态的工作负载,AOM界面显示异常是什么原因? 在AOM页面看到工作负载的状态显示异常,但是实际上在CCE页面看工作负载是正常的。 图1 查看工作负载状态 可能的原因如下: ICAgent的版本过低。 ICAgent当前需要用户主动升级的,但是过旧的ICAgent版本可能存在状态上报延迟导致显示异常的问题。
使用限制 单账号跟踪的事件可以通过云审计控制台查询。多账号的事件只能在账号自己的事件列表页面去查看,或者到组织追踪器配置的OBS桶中查看,也可以到组织追踪器配置的CTS/system日志流下面去查看。 用户通过云审计控制台只能查询最近7天的操作记录。如果需要查询超过7天的操作记录,您必
如何区分Prometheus监控功能采集的基础指标和自定义指标数据? 用户可以登录AOM控制台,进入Prometheus实例的详情界面,通过查看Prometheus监控功能采集的指标数据类型,区分基础指标和自定义指标。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控
为什么购买的资源在“资源管理”界面看不到? 如果确认资源购买成功,请先通过“资源>我的资源”查看是否有此资源。如果确认资源已经展示在“我的资源”处,即可在“资源管理”界面,单击“刷新”,即可显示相关资源。 图1 查看资源 图2 刷新“资源管理”界面 父主题: 应用资源管理(即将下线)