检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
工作负载监控 工作负载监控是针对CCE、CCI工作负载的监控,通过工作负载监控您可以及时了解工作负载的资源使用、状态和告警等信息,以便快速响应处理告警或事件信息,保证工作负载顺畅运行。工作负载分为五种类型:无状态负载 Deployment、有状态负载 StatefulSet、守护进程
重启CCE工作负载 使用重启CCE工作负载卡片可以创建任务重启一个或多个CCE工作负载。 只支持对有状态负载和无状态负载进行重启,其余类型负载不支持。 创建重启CCE工作负载任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在
配置预聚合规则 预聚合(Recording Rule)可以对落地的指标数据做二次开发。某些查询可能需要在查询端进行大量的计算,导致查询端压力过大,通过配置预聚合规则将计算过程提前到写入端,可减少查询端资源占用,尤其在大规模集群和复杂业务场景下可以有效的降低PromQL的复杂度,从
正常状态的工作负载,AOM界面显示异常是什么原因? 在AOM页面看到工作负载的状态显示异常,但是实际上在CCE页面看工作负载是正常的。 图1 查看工作负载状态 可能的原因如下: ICAgent的版本过低。 ICAgent当前需要用户主动升级的,但是过旧的ICAgent版本可能存在状态上报延迟导致显示异常的问题。
创建Prometheus实例的预聚合规则 功能介绍 该接口用于给Prometheus实例创建预聚合规则。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/{prometheus_instance}/aom/api/v1/rules 表1 路径参数
单击“确定”完成创建。如图5所示,创建了一个名为“test-aom”的多账号聚合实例。 图5 Prometheus 实例列表 在“Prometheus实例”列表中单击创建的多账号聚合实例的名称,进入多账号聚合实例的“账号接入”页面,选择需要接入的账号,云服务及云服务指标。 例如,成
数。 图1 两个yaml文件对比 解决方法 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“工作负载 ”,选择需要上报到AOM的工作负载类型。 在该工作负载对应的“操作”列中选择“更多 > 编辑YAML”。 在弹出的“编辑YAML”对话框中找到spec.template
Prometheus实例 for 多账号聚合实例 多账号聚合Prometheus实例类型,提供对同一组织下多个成员账号的云服务指标监控。 前提条件 已在组织控制台界面启用AOM 可信服务,具体操作请参见启用、禁用可信服务。 同一组织下多个成员账号均已接入云服务指标。 创建多账号聚合Prometheus实例
云服务监控展示华为云各服务实例的历史性能数据曲线,最长可查看近1个月内的数据,有助于您了解云服务实例运行状况。 当前支持如下云服务的监控: 弹性负载均衡(ELB)、虚拟私有云(VPC)、关系型数据库(RDS)、分布式缓存服务(DCS)、云硬盘(EVS)、对象存储服务(OBS)、文档数据库
当您开通了VPC后,无需额外安装其他插件,即可在AOM界面监控VPC的运行状态及各种指标。 弹性负载均衡服务 弹性负载均衡服务(Elastic Load Balance,简称ELB)是将访问流量根据转发策略分发到后端多台云服务器流量分发控制服务。弹性负载均衡可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。
当您开通了VPC后,无需额外安装其他插件,即可在AOM界面监控VPC的运行状态及各种指标。 弹性负载均衡服务 弹性负载均衡服务(Elastic Load Balance,简称ELB)是将访问流量根据转发策略分发到后端多台云服务器流量分发控制服务。弹性负载均衡可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。
容器监控和组件监控的区别在于所监控的对象不同。 组件监控是全量监控,监控对象为通过CCE部署的工作负载、通过ServiceStage创建的应用,或直接在ECS或BMS上部署的组件。 容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建的应用。 组件监控详细操作请参见:组件监控。
您可以进入AOM的容器监控页面,在工作负载的监控视图里查看服务在各个时间的状态值,0代表正常,非0代表异常。 父主题: 常见使用问题
在左侧导航栏选择“基础设施监控 > 工作负载”,进入“工作负载”页面。 单击任一工作负载页签下的工作负载名称,可查看该工作负载的名称、状态、集群、命名空间等详细信息。例如图1所示,展示了工作负载“coredns”的详细信息,其所属集群名称为“aom-doc-test”。 如需监控其他工作负载,可参考创建工作负载为CCE集群创建工作负载。
开源的分布式服务发现与配置管理,支持多数据中心,强一致性。具体操作请参见:接入指标(AOM)。 HAProxy 高性能TCP/HTTP反向代理负载均衡器,支持高并发,灵活配置,确保服务高可用。具体操作请参见:接入指标(AOM)。 PostgreSQL 功能强大的开源对象-关系数据库系统
针对指标aom_container_memory_used_megabytes,使用聚合函数sum,按照nodeIP和podID进行指定node下指定pod当前的内存实际占用量计算。 针对指标aom_node_memory_total_megabytes,使用聚合函数sum,按照nodeIP计算出指定node的内存总量。
单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。 云容器引擎CCE - 工作负载 负载名称、命名空间、集群、负载类型、区域、应用环境、最近更新时间。 单击“负载名称”列的某个负载名称,展示“Workload实例详情”。 单击“应用环境”列的某个环境链接,跳转至“应用管理”已关联的资源页面。
接入Prometheus后,为什么会产生额外费用? CCE容器场景 通常情况下,用户购买CCE集群,部署工作负载之后,默认会采集cluster、Pod、Container、Node等基础指标-容器指标,基础指标的上报不产生费用。 产生计费的可能原因是: Prometheus实例内
域,可以获取当前Prometheus实例的Remote Read和Remote Write Prometheus配置代码。在云服务、多账号聚合、APM类型的Prometheus实例的“设置”页签下“服务地址”区域,可以获取当前Prometheus实例的Remote Read Prometheus配置代码。
通过添加自定义标签,用户可以在日志页面上查看到自定义标签,如果将aom日志接入lts后,可以通过该自定义标签关键字进行日志搜索。 编辑yaml:通过在工作负载的yaml中spec:template:metadata:annotations:下增加以下字段来实现 kubernetes.AOM.log