检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。AOM并非传统监控,它通过应用的角度看业务,满足企业对业务的高效和快速迭代的需求,可帮助企业实现IT对业务的有效支撑,保护、优化IT资产投资,使企业更好的达到其战略目标并实现IT资产调优。
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
AOM提供多场景、多层次、多维度指标与日志数据的监控能力,通过旧版接入中心快速接入需要监控的指标和日志,接入完成后,即可方便地在“指标浏览”页面查看相关资源或应用的运行状态、各个指标的使用情况、接入的日志等信息。 约束与限制 如果您进入的是新版接入中心,需要单击“接入中心”页面右上角“返回旧版”返回至旧版接入中心页面。
查询时序数据 场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格式
r”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 采集规则YAML配置样例如下,样例的指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标: apiVersion: monitoring
r”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 采集规则YAML配置样例如下,样例的指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标: apiVersion: monitoring
了解 AOM是云上应用的一站式立体化运维管理平台。 产品介绍 什么是AOM 应用场景 与其他服务的关系 约束与限制 指标总览 基本概念 03 入门 快速了解AOM服务在不同应用场景中的操作流程。 快速入门 监控云容器引擎 CCE的指标 05 实践 提供典型场景的最佳实践操作指导您更好地使用AOM。
使用Prometheus监控ECS主机的指标 弹性云服务器(Elastic Cloud Server,简称ECS)是由CPU、内存、操作系统、云硬盘组成的一种可随时获取、弹性可扩展的云服务器,ECS提供了丰富的网络和安全功能,如VPC、安全组、云防火墙等,帮助用户构建安全、可靠的云上环境。应用运维管理(Application
9104 验证MySQL Exporter是否部署成功。 在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露对应的访问地址。 图3 查看日志 输入命令验证MySQL Exp
通过AOM界面您可监控FunctionGraph的基础资源和运行在其上的应用,同时在AOM界面还可查看相关的日志和告警。 智能边缘平台 智能边缘平台(Intelligent EdgeFabric,简称IEF)通过纳管您的边缘节点,提供将云上应用延伸到边缘的能力,联动边缘和云端的数据,满足客户对边缘计算资源的远程管控、
非传统监控,它通过应用的角度看业务,满足企业对业务的高效和快速迭代的需求,可帮助企业实现 IT 对业务的有效支撑,保护、优化IT资产投资,使企业更好的达到其战略目标并实现IT资产价值的最大化。通过云审计服务,您可以记录与AOM服务相关的操作事件,便于日后的查询、审计和回溯。 开通云审计服务
面。 勾选“类型”下的“云服务”前的复选框,筛选出云服务卡片。 单击卡片上的“接入指标(AOM)”或“接入日志(LTS)简介”链接,可快速接入指标、日志或查看接入LTS相关的操作文档。 接入指标(AOM):AOM提供云服务指标接入AOM的能力。通过云服务卡片的“接入指标(AOM)”链接,可快速接入云服务相关指标。
累计触发:某个监控周期内,事件或者告警满足筛选条件的次数达到设置的累计次数,按照设置的频率发送对应的告警通知。频率设置为NA时,无通知次数限制,即事件或者告警满足筛选条件的次数达到设置的累计次数就会发送一次通知。 例如,设置事件名称为“数据卷扩容失败”,监控周期为“20分钟”,累计次数为“>
探针版本 选择探针的版本。探针版本的类型建议与工作负载所在node节点的CPU架构对应版本一致。 探针升级策略 探针升级的方式、策略。默认为“重启自动升级”。 重启自动升级:每次都尝试重新下载镜像。 重启手动升级:如果本地有该镜像,则使用本地镜像,本地不存在时下载镜像。 APM环境
说明: AOM的日志绕接能力是使用copytruncate方式实现的,如果选择了设置,请务必保证您写日志文件的方式是append(追加模式),否则可能出现文件空洞问题。 当前主流的日志组件例如Log4j、Logback等均已经具备日志文件的绕接能力,如果您的日志文件已经实现了
分组条件 根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。 取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以
基础设施监控 通过helm部署pod后,AOM无法查找到工作负载
r”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 采集规则YAML配置样例如下,样例的指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标: apiVersion: monitoring
服务场景 服务场景概述 启动ECS实例 关闭ECS实例 重启RDS实例 修改ECS非管理员密码 重启CCE工作负载 清理磁盘空间 父主题: 运维管理
String 工作流执行ID。 最小长度:1 最大长度:64 表2 Query参数 参数 是否必选 参数类型 描述 action 是 String 对当前节点的操作:失败重试,失败跳过,暂停继续。 restart可重新执行失败的节点,skip可跳过失败的节点进入下个节点的执行,con