检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
PAAS.CONTAINER 组件指标、实例指标、进程指标和容器指标的命名空间。 PAAS.SLA SLA指标的命名空间。 自定义指标的命名空间:用户自定义,自定义时命名空间必须以字母开头,但不能以“PAAS.”
其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计信息中。维度是指标的分类,每个指标都包含用于描述该指标的特定特征,可以将维度理解为这些特征的类别。
scale_in_k8s、scale_in_vm表示缩容。 说明: 含有k8s的表示容器应用,含有vm的表示进程应用。 parameters 是 参见表7 - 包含扩缩容的实例数。
可观测性分析 基于四层指标体系(基础设施层指标、中间件层指标、应用层指标和业务层指标),通过事务监控、容器监控、普罗监控等功能,提供异常检测、历史数据分析、性能分析、关联性和场景化分析等可观测性分析能力。
应用运维管理(AOM)、API网关(APIG)、Astro轻应用(Astro Zero)、裸金属服务器(BMS)、云堡垒机(CBH)、云容器引擎(CCE)、内容分发网络(CDN)、云防火墙(CFW)、云审计服务(CTS)、分布式缓存服务(DCS)、文档数据库服务(DDS)、华为云DDoS
配置CCE集群监控采集指标规则 AOM支持通过新增ServiceMonitor或PodMonitor的方式为应用配置可观测监控 Prometheus 版的采集规则,来监控部署在CCE集群内的应用的业务数据。
Cluster-Id 集群ID 必选 - Namespace 命名空间 必选 - X-Auth-Token 从IAM服务获取的用户Token。
- 资源类型 根据实际选择资源类型:集群、主机、应用、组件、实例、进程和容器。 说明: 资源添加方式选择“指定资源”才会显示。 集群 资源名称 展示勾选的资源名称。 说明: 资源添加方式选择“指定资源”才会显示。 arm-test-77169 资源列表 勾选资源名称。
如果需要将CCE的工作负载上报到AOM中,并挂载到“应用监控”页面左侧的应用树中以组件形式体现,需要先升级工作负载。具体操作如下: 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“工作负载 ”,选择需要上报到AOM的工作负载类型。
URI GET /v1/{project_id}/{cluster_id}/{namespace}/agents 表1 路径参数 参数 是否必选 参数类型 描述 cluster_id 是 String 查询集群主机时,填写集群id。 查询用户自定义主机时,填写“APM”。
配置虚机日志的采集路径时,不建议和容器服务日志映射到虚拟机上的日志目录相同,若相同则采集到的日志内容会互相覆盖掉,采集的日志可能会变成容器日志。 界面方式-单虚机 登录AOM控制台,在左侧导航栏中选择“日志 > 日志路径”,选择“主机日志”页签。
Prometheus实例创建成功后,您可根据需要在Prometheus实例详情页面的子菜单中执行以下相关接入操作: 表2 相关操作 子菜单 功能说明 集成中心 AOM集成容器服务CCE集群的Prometheus云原生监控插件,支持在Prometheus实例的“集成中心”为CCE集群安装云原生监控插件
管理AccessCode AccessCode是调用API的身份凭据。通过创建AccessCode可为当前用户配置API服务的调用权限。该权限设置针对整个AOM 2.0服务生效。 约束与限制 每个用户最多可创建2个AccessCode。
{ "errorCode" : "SVCSTG_AMS_2000000", "errorMessage" : "success", "metrics" : [ { "metric" : { "namespace" : "PAAS.CONTAINER"
重启CCE工作负载 使用重启CCE工作负载卡片可以创建任务重启一个或多个CCE工作负载。 只支持对有状态负载和无状态负载进行重启,其余类型负载不支持。 创建重启CCE工作负载任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。
关联CCE类型Prometheus实例的告警规则触发的告警:单击告警详情页中涉及容器相关资源的cluster_name、node、pod、container时,可以跳转至AOM的系统内置仪表盘中查询相应时间的指标曲线。
原因分析 在CCE控制台的工作负载页面找到通过helm部署的pod记录,然后对比helm部署pod的yaml文件和直接在CCE控制台部署pod的yaml文件,发现helm部署pod的yaml文件中缺少env参数。
取值范围: PAAS.CONTAINER:组件指标、实例指标、进程指标和容器指标的命名空间, PAAS.NODE: 主机指标、网络指标、磁盘指标和文件系统指标的命名空间, PAAS.SLA:SLA指标的命名空间, PAAS.AGGR:集群指标的命名空间, CUSTOMMETRICS
表7 AOM控制台依赖服务的角色或策略 控制台功能 依赖服务 需配置角色/策略 工作负载 集群监控 Prometheus for CCE 云容器引擎 CCE 如果使用Prometheus for CCE、工作负载监控和集群监控,需要设置CCE FullAccess权限和CCE命名空间权限
在“选择策略”页签选择“DMS UserAccess”策略,并单击“下一步”。 DMS UserAccess策略:分布式消息服务普通用户权限(无实例创建、修改、删除、扩容、转储)。