检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
管理主机的UniAgent UniAgent安装成功后,支持对主机的UniAgent进行重装、升级、卸载和删除操作。 约束与限制 如果通过旧版方式安装UniAgent的主机是Windows操作系统,需在主机上手动执行重装UniAgent操作。 UniAgent暂时不提供自动升级,而是根据您的需求自主进行升级。
通过多账号聚合Prometheus实例实现指标数据统一监控 本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 应用场景 某电商平台运维人员在监控指标时,只能实时监控一个账号下的指标数据,无法同时监控其他账号。 解决方案 AOM通过Prometheus监控功能,创建多
管理主机的UniAgent UniAgent安装成功后,支持对主机的UniAgent进行重装、升级、卸载和删除操作。 约束与限制 如果通过旧版方式安装UniAgent的主机是Windows操作系统,需在主机上手动执行重装UniAgent操作。 UniAgent暂时不提供自动升级,而是根据您的需求自主进行升级。
运行环境接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持运行环境接入AOM。即可将CCE 、CCI容器指标和ECS虚机指标上报到AOM。 配置运行环境接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 > 接入中心”,进入接入中心页面。(如果
功能总览 功能总览 全部 应用运维管理 接入中心 仪表盘 告警管理 指标浏览 日志分析(新版) 日志分析(旧版) 应用洞察(日落) Prometheus监控 业务监控(BETA) 基础设施监控 应用监控 智能洞察(BETA) 自动化运维(日落) 设置 APM配置 应用运维管理 应用运维管理(Application
产品架构 AOM是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集
选择待操作的仪表盘,在“仪表盘”页面右上角单击后的下拉箭头,开启仪表盘自动刷新开关。 轮播仪表盘 选择待操作的仪表盘,在“仪表盘”页面右上角单击。具体操作请参见设置全屏模式在线时长。 查询时间设置 选择待操作的仪表盘,在“仪表盘”页面右上角单击前面的下拉框,在下拉框可选择“近30分钟”、“近1小时”、“近6小时”
仪表盘监控 AOM仪表盘监控概述 创建AOM仪表盘 创建AOM仪表盘(新版) 设置AOM仪表盘全屏模式在线时长 设置AOM仪表盘过滤器 可观测大屏监控 统计图表说明 统计图表说明(新版)
业务层接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持监控ELB日志指标、APM事务监控指标等,例如用户数、订单数。 配置业务层接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 > 接入中心”,进入接入中心页面。(如果您进入的是新版接入中心
管理主机的ICAgent插件 AOM将陆续支持其他各种类型插件的接入功能,您可以在安装了UniAgent的主机列表界面,直接对主机进行批量安装、升级、卸载、启动、停止和重启插件的操作。 当前已对接的插件有:ICAgent。ICAgent插件为指标和日志采集插件。ICAgent插件采集据周期为1分钟,不支持修改。
管理主机的ICAgent插件 AOM将陆续支持其他各种类型插件的接入功能,您可以在安装了UniAgent的主机列表界面,直接对主机进行批量安装、升级、卸载、启动、停止和重启插件的操作。 当前已对接的插件有:ICAgent。ICAgent插件为指标和日志采集插件。ICAgent插件采集据周期为1分钟,不支持修改。
设置全屏模式在线时长 选择待操作的仪表盘,在“仪表盘”页面右上角单击。 在弹出的对话框中设置全屏模式在线时长。 图8 设置在线时长 说明: 自定义在线时长:默认在线时长为1小时,您可在文本框中输入1~24小时。 例如,在文本框中输入2,则2小时后自动退出到登录界面。 保持在线:表示不
构造请求 本章节介绍如何构造REST API的请求,并以调用IAM服务的管理员创建IAM用户接口说明如何调用API。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com/videos/102987 。 请求URI 请求URI由如下部分组成。
错误码 当您调用API时,如果遇到“APIGW”开头的错误码,请参见API网关错误码进行处理。 更多服务错误码请参见API错误中心。 状态码 错误码 错误信息 描述 处理措施 200 SVCSTG.INV.2000000 null 请求正常执行 请求执行完成无需处理。 200 SVCSTG_AMS_2000000
权限管理 如果您需要对AOM资源给企业中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全地控制AOM资源的访问。
主机指标及其维度 表1 主机指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_node_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。
如何获取Prometheus实例的服务地址? 用户可以登录AOM控制台,进入Prometheus实例的详情页面,获取Prometheus实例的服务地址。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”,在实例列表中单击已创建的Prometheus实例的实例名称。
用户高频问题 新创建应用、服务等资源后,AOM界面为何不实时显示监控数据? 当您新创建了主机、应用、组件、进程等资源后,ICAgent会以10分钟为周期进行周期性监控数据上报,AOM界面需要等待一个上报周期后方可展示相关监控数据。 删除主机、工作负载等资源后,AOM界面为何仍然显示资源状态为正常?
快速管理应用 本章节介绍在“总览”页面的应用视角下,如何通过AOM快速管理应用,包括应用创建到发现、监控等操作。主要操作如下: 创建应用:通过CMDB创建应用和资源关系树,在应用所在主机安装采集器。 配置告警:创建指标告警规则,应用异常时发送通知。 配置告警行动规则:配置告警处理策略,如应用异常时自动重启。
资源运行异常怎么办? 资源状态包括正常、亚健康、异常和通道静默。亚健康、异常或通道静默都可能导致资源运行异常,您可参考如下指导进行分析和修复。 亚健康 当有级别为次要或提示的告警时资源状态为亚健康。 修复建议:请在告警界面参考告警详细信息处理告警。 异常 当有级别为紧急或重要的告警时资源状态为异常。