-
ICAgent安装成功后,无法在界面上获取到ICAgent状态 - 应用运维管理 AOM
用户侧使用虚拟网卡,想要获取到ICAgent状态信息需要修改下相关脚本规避。 解决办法 以root用户登录已安装ICAgent的CCE集群的某个主机服务器。 执行以下命令,查看正在使用的hostIP地址,如图1所示。 netstat -nap | grep establish -i 图1 查看hostIP地址
-
日志分析(新版) - 应用运维管理 AOM
日志分析(新版) AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中日志分析相关功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中日志分析相关功能。
-
约束与限制 - 应用运维管理 AOM
由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。
-
通过多账号聚合Prometheus实例实现指标数据统一监控 - 应用运维管理 AOM
账号接入”页面,选择需要接入的账号,云服务及云服务指标。 例如,成员账号接入“paas_apm、paas_aom”。云服务选择接入“函数工作流 FunctionGraph、分布式缓存 DCS、弹性云服务器 ECS”。在云服务列表中选择云服务后,单击“新增指标”,可以在新增指标弹框里勾选任意需要接入的指标。
-
概述 - 应用运维管理 AOM
通过拓扑图,一方面可以自动梳理服务之间的调用关系,同时也可以从全局视角查看服务之间调用是否正常,快速定位问题。 调用链 在企业微服务之间调用复杂的场景下,Agent会抽样一些请求,拦截对应请求及后续一系列的调用信息。 探针管理 Agent通过字节码增强技术进行调用埋点,运行在应用所在的服务器上,实时采集应用性能相关的数据。
-
ICAgent管理(华为云主机) - 应用运维管理 AOM
ICAgent管理(华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
-
ICAgent管理(非华为云主机) - 应用运维管理 AOM
ICAgent管理(非华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
-
添加或修改服务发现规则 - 应用运维管理 AOM
401 Unauthorized 在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 403 Forbidden 请求被拒绝访问。返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。
-
容器日志采集配置 - 应用运维管理 AOM
容器日志采集配置 添加自定义标签字段 标准输出配置 父主题: 日志管理
-
清理磁盘空间 - 应用运维管理 AOM
在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“服务场景”,在服务场景页面单击“清理磁盘空间”卡片,或单击卡片右上角的选择“创建任务”,进入创建清理磁盘任务页面。 填写基本信息,具体的参数参见表1。 图1 创建清理磁盘空间任务 表1 创建清理磁盘空间任务 参数名称 说明
-
配置指标 - 应用运维管理 AOM
服务已接入云服务类型Prometheus 监控并接入云服务,具体请参见Prometheus实例 for 云服务。 服务已接入ECS类型Prometheus监控并接入插件,具体请参见Prometheus实例 for ECS。 注意事项 目前仅default类型、CCE类型、云服务类型、ECS类型的Prometheus实例支持指标查看、新增和废弃功能。
-
创建仪表盘 - 应用运维管理 AOM
表盘中,以便再次打开AOM时无需重新选择指标就可进行例行检查任务。 注意事项 系统预置的仪表盘模板都保存在“系统内置”分组下,包含容器、云服务、原生中间件、应用四种。预置仪表盘不允许删除或调整分组,仪表盘模板不支持创建。 系统预置的容器类型仪表盘需要在CCE集群下的“插件管理”中
-
如何将Prometheus数据接入到AOM? - 应用运维管理 AOM
根据需要参考对应的创建操作,具体请参见: Prometheus实例 for ECS Prometheus实例 for CCE Prometheus实例 for Remote Write 将原生Prometheus的指标通过Remote Write地址上报到AOM服务端。具体请参见 将Prometheus的数据上报到AOM。
-
服务韧性 - 应用运维管理 AOM
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
-
升级ICAgent - 应用运维管理 AOM
其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。 父主题: ICAgent管理(华为云主机)
-
查询审计事件 - 应用运维管理 AOM
查询审计事件 操作场景 用户进入云审计服务创建管理类追踪器后,系统开始记录云服务资源的操作。在创建数据类追踪器后,系统开始记录用户对OBS桶中数据的操作。云审计服务管理控制台会保存最近7天的操作记录。 本节介绍如何在云审计服务管理控制台查看或导出最近7天的操作记录: 在新版事件列表查看审计事件
-
统计资源消耗 - 应用运维管理 AOM
通过Prometheus监控服务将指标数据上报到AOM后,即可在“资源消耗”界面查看上报的基础指标和自定义指标数量,方便用户分析资源使用情况。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见: Prometheus实例 for ECS Prometheus实例
-
升级ICAgent - 应用运维管理 AOM
t预计需要1分钟左右,请耐心等待。待ICAgent的状态由“升级中”变为“运行”时,表示升级成功。 父主题: ICAgent管理(非华为云主机)
-
执行任意类型任务失败 - 应用运维管理 AOM
问题描述 通过cmdb树选择云服务资源执行任意任务时失败,提示:Access denied, The {ECS Instance/RDS Instance/WorkLoad} does not belong to the current project, {ECS Instance/RDS
-
权限管理 - 应用运维管理 AOM
限,再按如下表7增加依赖服务的角色或策略。 用户首次开通AOM服务,AOM会为其创建服务委托,用户除需授权AOM FullAccess外,还需要授予Security Administrator。 表7 AOM控制台依赖服务的角色或策略 控制台功能 依赖服务 需配置角色/策略 工作负载