检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OM 2.0服务。 为用户添加应用运维管理AOM和云容器引擎CCE的操作权限。 您需要有AOM的管理员权限“AOM FullAccess”和CCE的管理员权限“CCE FullAccess”,具体操作请参考创建用户并授权使用AOM和集群权限(IAM授权)。 容器监控 登录AOM 2
下单击“PodMonitor”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 图3 新增PodMonitor 配置完成后,新增的采集规则将显示在下方的列表中。 图4 配置采集规则 其他相关操作 CCE集群的指标管理配置完成后,您还可以执行表1中的操作。
指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的,均以“PAAS
管理CCE集群的ICAgent插件 AOM支持对您已购买的CCE(云容器引擎)集群下的主机批量执行ICAgent插件安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。
管理CCE集群的ICAgent插件 AOM支持对您已购买的CCE(云容器引擎)集群下的主机批量执行ICAgent插件安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。
使用Prometheus监控CCE集群指标 AOM基于Prometheus监控生态,提供了托管式的CCE类型Prometheus实例 ,适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。CCE Prometheus实例默认提供对容器服务CCE集群的Prometheus云原生监控插件的集成。为
应用洞察下的应用监控和进程监控下的应用监控有什么区别? AOM 2.0控制台中存在两个“应用监控”功能,入口不同,对应的功能也不同。 入口为:“应用洞察 > 应用监控” 主要监控用户通过应用资源管理功能统一管理的所有资源对象与应用,通过该应用监控可以及时了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行。
输入搜索条件或关键字,从CMDB服务中选取实例。当前节点类型支持两种选择方式,静态IP和动态节点。 静态IP:可选中指定CMDB应用下的CCE实例。 动态节点:选择CMDB应用中的节点,从而动态获取节点下的CCE实例。该方式对节点下未来新增的实例也生效。 如需设置审批配置、执行策略,可展开“更多设置”进行配置,配置参数如表3。
“PodMonitor”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 采集规则YAML配置样例如下,样例的指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标: apiVersion:
us官方文档。 添加AccessCode。 登录AOM控制台,在左侧导航栏中选择“配置管理 > 接入管理”。 单击“添加AccessCode”。 图1 添加AccessCode 每个项目最多可创建2个AccessCode。 AccessCode是调用API的身份凭据,请您妥善保管。
FullAccess、DMS ReadOnlyAccess和CCE命名空间权限 AOM ReadOnlyAccess AOM2.0只读权限,拥有该权限的用户仅能查看AOM数据。 系统策略 CCE ReadOnlyAccess、DMS ReadOnlyAccess和CCE命名空间权限
否 String 绑定的告警行动规则名称。 related_cce_clusters 否 String CCE集群id。 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 从IAM服务获取的用户Token。获取方式请参见:获取Token。
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上
如何启用NGINX stub_status模块? Nginx Prometheus Exporter是通过Nginx的stub_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,以root权限
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能
标准输出配置 通过添加指定采集容器标准输出标签,用户可以指定采集pod下的对应容器名的标准输出日志。用户在pod的yaml中spec:template:metadata:annotations:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout:
执行以下命令,获取ACCESS的IP地址。 cat /opt/oss/servicemgr/ICAgent/envs/ICProbeAgent.properties | grep ACCESS_IP 依次执行以下命令,检查8149端口的连通性。 curl -k https://ACCESS_IP:8149
该指标用于统计测量对象的NPU存储容量。仅支持CCE类型主机的NPU指标采集。 >0 兆字节(MB) aom_node_npu_memory_usage NPU存储使用率 该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。仅支持CCE类型主机的NPU指标采集。 0~100 百分比(%) aom_n
磁盘分区指标 当主机类型为“CCE”时,可以查看磁盘分区指标,支持的系统为:CentOS 7.6版本、EulerOS 2.5。 以root用户登录CCE节点,执行docker info | grep 'Storage Driver'命令查看docker存储驱动类型。如果执行结果为“Device
相同的指标维度。(仅value不同) 将上述两者获得的指标值进行“/”运算,即可获得pod的内存实际使用率。 pod的内存实际使用率的普罗语句如下所示: sum(aom_container_memory_used_megabytes{podID="****1461-41d8-****-bfeb-fc1213****"