检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
管理主机的UniAgent UniAgent安装成功后,支持对主机的UniAgent进行重装、升级、卸载和删除操作。 约束与限制 如果通过旧版方式安装UniAgent的主机是Windows操作系统,需在主机上手动执行重装UniAgent操作。 UniAgent暂时不提供自动升级,而是根据您的需求自主进行升级。
运行环境接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持运行环境接入AOM。即可将CCE 、CCI容器指标和ECS虚机指标上报到AOM。 配置运行环境接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 > 接入中心”,进入接入中心页面。(如果
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录AOM的管理事件用于审计。
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录AOM的管理事件用于审计。
管理主机的ICAgent插件 AOM将陆续支持其他各种类型插件的接入功能,您可以在安装了UniAgent的主机列表界面,直接对主机进行批量安装、升级、卸载、启动、停止和重启插件的操作。 当前已对接的插件有:ICAgent。ICAgent插件为指标和日志采集插件。ICAgent插件采集据周期为1分钟,不支持修改。
管理主机的ICAgent插件 AOM将陆续支持其他各种类型插件的接入功能,您可以在安装了UniAgent的主机列表界面,直接对主机进行批量安装、升级、卸载、启动、停止和重启插件的操作。 当前已对接的插件有:ICAgent。ICAgent插件为指标和日志采集插件。ICAgent插件采集据周期为1分钟,不支持修改。
Prometheus监控概述 Prometheus监控全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘和全面托管的Prometheus服务。 Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活查询语句PromQ
功能总览 功能总览 全部 应用运维管理 接入中心 仪表盘 告警管理 日志管理 Prometheus监控 基础设施监控 应用性能&用户体验监控 云服务监控 设置 应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的
订阅AOM指标或告警数据 AOM支持用户订阅指标或者告警信息。订阅后可以将数据转发到用户配置的DMS或Webhook的Topic中,供消费者消费转发订阅的信息。 约束与限制 最多可创建10个数据订阅规则。 Webhook订阅类型当前受限开放,如有需求可以通过提交工单,联系工程师为您开放此功能。
coredns_cache_misses_total 缓存未命中次数 coredns_cache_requests_total 不同维度下DNS解析请求的计数 coredns_dns_request_duration_seconds_bucket DNS请求耗时直方图bucket co
ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 问题描述 ICAgent安装成功后,AOM无法监控到CPU内存使用率等信息。 原因分析 8149端口未连通。 用户侧节点时间与所在时区当前时间不一致。 解决方法 以root用户登录安装ICAgent的服务器。 执
建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维
主机指标及其维度 表1 主机指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_node_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。
ICAgent安装成功后,无法在界面上获取到ICAgent状态 问题描述 ICAgent安装成功后,无法在界面上获取到ICAgent状态。 原因分析 用户侧使用虚拟网卡,想要获取到ICAgent状态信息需要修改下相关脚本规避。 解决方法 以root用户登录已安装ICAgent的CCE集群的某个主机服务器。
下发批量安装UniAgent任务 功能介绍 该接口用于下发批量安装UniAgent任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/uniagent-console/mainview/batch-import 表1 路径参数 参数 是否必选
配置数据多写实现监控指标转储到自建Prometheus 通过数据多写功能,可以实现跨VPC的访问,而不必暴露服务端相关的网络信息,以更加安全、可靠的方式将监控数据上报到自建Prometheus中。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。
资源运行异常怎么办? 资源状态包括正常、亚健康、异常和通道静默。亚健康、异常或通道静默都可能导致资源运行异常,您可参考如下指导进行分析和修复。 亚健康 当有级别为次要或提示的告警时资源状态为亚健康。 修复建议:请在告警界面参考告警详细信息处理告警。 异常 当有级别为紧急或重要的告警时资源状态为异常。
应用层接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持将应用层组件的调用链接入APM,来监控应用相关的性能图表或接口性能指标等。例如:请求平均时延、错误调用次数、请求吞吐量等。 配置应用层接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 >
公共请求消息头 表1 公共请求消息头 名称 描述 是否必选 示例 X-Auth-Token 用户Token。 使用Token认证时必选 - Content-Type 内容类型。 该字段内容填为“application/json;charset=utf8”。 必选 applicat
资源监控 表1 资源监控基本概念 术语 说明 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计