检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云日志服务LTS是华为云统一日志管理平台,提供日志搜索、结构化和可视化等功能。通过添加接入规则,可以将AOM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。
操作步骤如下: 登录华为云管理控制台。 在左上角单击,在下拉列表中选择操作区域。 单击左侧,选择“管理与监管 > 应用运维管理 AOM”,进入AOM服务页面。 在弹出的对话框中单击“免费开通”,即可免费开通AOM。
什么是应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化运维方案
丰富的数据源 融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源。 全栈一体化监控 覆盖用户端、服务端及云产品所有监控数据,提供从数据发现、数据展示到数据异常告警的全方位、可视化监控服务,实现从上到下、从前端到后端的全栈一体化监控。
该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全地控制华为云资源的访问。详情请参考AOM权限管理。 父主题: 安全
华为云根据客户等级定义了不同客户的宽限期和保留期时长。 关于充值的详细操作请参见账户充值。 父主题: 计费模式
因而使用云上托管Prometheus已成为越来越多上云企业的第一选择。 解决方案 AOM全面对接开源Prometheus生态,将容器服务Kubernetes集群接入Prometheus监控,通过Grafana大盘监控主机和Kubernetes集群的众多性能指标。
资源监控使用说明 满足内置发现规则的服务,安装ICAgent后该服务会自动被发现;对于不满足内置应用发现规则的服务,您则需配置应用发现规则。 资源监控使用说明如下: 图1 资源监控使用说明 父主题: 资源监控
表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、工作负载监控、集群监控、主机监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 应用发现最佳实践 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。
事件巡检 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小时内的历史数据,形成动态上界
Memcached Exporter接入 操作场景 使用Memcached过程中需要对Memcached运行状态进行监控,以便了解Memcached服务是否运行正常,排查Memcached故障等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Memcached
Memcached Exporter接入 操作场景 使用Memcached过程中需要对Memcached运行状态进行监控,以便了解Memcached服务是否运行正常,排查Memcached故障等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Memcached
高危命令说明 高危命令指影响系统或服务的正常运行,或造成系统特殊文件被恶意删除或修改命令。自动化运维服务涉及的高危命令请参见表1。 表1 高危命令说明 高危命令名称 高危命令校验规则 样例 导致风险 vi /etc/xxx.xx command \\s*(vi|vim)\\s+/(
事件根因分析 事件根因分析服务提供异常事件快速根因定位分析的功能,根因分析基于事件巡检看护的服务历史数据,根据服务指标、调用链数据进行下钻分析,细粒度定位根因。 功能入口 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。 在页面右上角设置应用的时间范围。可通过如下两种方式设置时间范围
Prometheus实例 for CCE CCE Prometheus实例类型,适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。默认提供对容器服务CCE集群的监控集成,也可通过接入中心添加容器服务集群中的各种组件的监控。 注意事项 在CCE “插件市场” 页面存在云原生监控插件
基础指标:IEF指标 介绍IEF服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 IEF服务的指标上报到AOM后,系统会根据指标映射规则将IEF指标转换后,呈现在AOM控制台的“指标浏览”界面。 表1 IEF服务监控指标 指标类别 分类 AOM呈现的指标 IEF上报的指标
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上报的信息
作业管理 “作业管理”页面展现所有作业信息,您可在这里新建作业,也可以创建执行方案、删除执行方案,并将作业的执行方案发布成服务。发布的服务可以在服务场景查看。 注意事项 作业管理最多可以创建1000个作业。 每个作业最多支持创建20个全局参数、20个作业步骤、50个执行方案。 创建作业