检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust? 如何通过创建委托获取AK/SK
Exporter可以采集监控数据并通过Prometheus监控规范对外提供数据。 图2 安装Exporter 参数 说明 Kafka地址 Kafka的IP地址和端口号,例如:10.0.0.1:3306。 开启SASL 是否需要启用SASL(Simple Authentication and Security
Exporter可以采集监控数据并通过Prometheus监控规范对外提供数据。 图2 安装Exporter 参数 说明 Kafka地址 Kafka的IP地址和端口号,例如:10.0.0.1:3306。 开启SASL 是否需要启用SASL(Simple Authentication and Security
ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 如何获取AK/SK? UniAgent和ICAgent安装类常见问题 如何在VPCEP控制台为AOM/LTS创建终端节点? 如何启用NGINX stub_status模块? APM指标数据未采集上来,可能有哪些原因? E
Prometheus监控 如何将Prometheus数据接入到AOM? 如何区分Prometheus监控功能采集的基础指标和自定义指标数据? 如何获取Prometheus实例的服务地址? 不能废弃以aom_prom_fixed作为前缀的指标
AOM的日志绕接能力是使用copytruncate方式实现的,如果选择了设置,请务必保证您写日志文件的方式是append(追加模式),否则可能出现文件空洞问题。 当前主流的日志组件例如Log4j、Logback等均已经具备日志文件的绕接能力,如果您的日志文件已经实现了绕接能力,则无需设置。否则可能出现冲突。
账号接入 AOM支持在Prometheus实例的“接入账号”中将同一组织下多个成员账号接入AOM后,实现对同一组织下多个成员账号的云服务指标进行监控。通过数据多写功能,可以实现跨VPC的访问,而不必暴露服务端相关的网络信息。 表3 监控指标采集 功能 功能说明 管理Prometheus实例指标数据
授权项:自定义策略中支持的Action,在自定义策略中的Action中写入授权项,可以实现授权项对应的权限功能。 依赖的授权项:部分Action存在对其他Action的依赖,需要将依赖的Action同时写入授权项,才能实现对应的权限功能。 IAM项目(Project)/企业项目(Enterprise
常见计费问题 如何查看每天的自定指标上报量? AOM控制台的“资源消耗”界面会展示每天指标上报量展示,具体操作请参见统计资源消耗。 如何查看有哪些Prometheus指标? 目前仅default类型、CCE类型、云服务类型的Prometheus实例支持指标查看功能。 登录AOM 2
技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
按创建时间、CPU使用率、集群名称等设置搜索条件,查看需要监控的集群。 单击集群名称,进入集群监控的详情页面。 在左侧导航栏可以按照健康中心、监控中心、日志中心、告警中心实现集群的云原生观测。(当前仅非洲-约翰内斯堡区域不开放。) 健康中心 集群健康诊断基于容器运维专家经验对集群健康状况进行全面检查,能够及时发
技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
产生阈值告警。 日志管理 AOM提供强大的日志管理能力。日志检索功能可帮您快速在海量日志中查询到所需的日志;日志转储帮您实现长期存储;通过创建日志统计规则实现关键词周期性统计,并生成指标数据,实时了解系统性能及业务等信息;通过配置分词可将日志内容按照分词符切分为多个单词,在日志搜索时可使用切分后的单词进行搜索。
索条件,实现进程过滤显示。 单击右上角的,可获取到设置的时间范围内进程的最新信息。 在CCE主机的“Pod实例”页签下,可查看实例状态、节点IP等信息。 单击实例名称,可逐层下钻查看该实例的容器、进程的详细信息。 在实例列表右上角的搜索框可按实例名称等设置搜索条件,实现实例过滤显示。
Prometheus监控 基础设施监控 应用监控 常见问题 了解更多常见问题、案例和解决方案 常见使用问题 如何区分告警和事件? 怎样查看AOM中的日志是通过哪个应用产生的? 如何区分Prometheus监控功能采集的基础指标和自定义指标数据? ICAgent和UniAgent是同一个插件吗?
None 操作指导 应用运维管理 AOM 如何创建告警规则 04:10 创建告警规则
其他常见问题 AOM 1.0与AOM 2.0使用对比 AOM与APM有何区别? AOM的日志服务与LTS的日志服务有何区别? 如何创建委托apm_admin_trust?
或“其他:用户自定义接入主机”。 升级ICAgent。如果在步骤2中下拉列表框中选择的是“集群:xxx”,则单击“升级ICAgent”。可实现整个集群的升级操作,即在ICAgent列表下的所有主机一次性完成升级。如果在步骤2中下拉列表框中选择的是“其他:用户自定义接入主机”,则先选择主机后单击“升级ICAgent”。
告警管理 如何区分告警和事件?
组件列表中对组件名称、状态、所属应用、部署方式、应用发现规则等参数进行展示。 为了方便您查看组件列表,您可以单击右上角图标对组件列表进行过滤显示,实现隐藏系统组件。 可以在组件列表上方设置过滤条件,实现组件列表过滤显示。 您可根据需要选择是否对组件执行如下操作: 添加别名 当组件名称比较复杂,不便于识别时,您可为该组件增加一个便于识别的别名。