检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
租户从IAM申请到的projectid,一般为32位字符串。 最小长度:32 最大长度:32 workflow_id 是 String 任务id,从工作流命令列表中获取的工作流id。 最小长度:1 最大长度:64 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 AOM提供了告警通知功能,您可通过创建通知规则进行详细配置,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,可利用此功能将告警信息通过邮件或短信发送给您指定的人员,以便提醒相关人员及时采取措施清除故障,避免造成业务损失。
参见:创建日志组和日志流,也可以在添加接入规则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南、CCI用户指南;已配置容器服务日志采集路径。 添加接入规则 将AOM中的CCE、CCI或自定义集群的日志映射至LTS需要进行如下操作步骤: 登录AOM控制台,在左侧导航栏中选择“日志
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态
参考文档链接 主机组管理 主机组是为了便于分类管理、提升配置多个主机日志采集的效率,对主机进行虚拟分组的单位。云日志服务支持通过一个接入配置来采集多台主机上的日志,您可以将这些主机加入到同一个主机组,并将该主机组关联至对应的接入配置中,方便您对多台主机日志进行采集。 登录AOM 2.0控制台。
参考信息 Agent包下载配置
创建消息模板 AOM提供消息模板功能,可通过创建消息模板自定义配置通知消息,当AOM触发已设定的告警通知策略时,可通过此功能以您自定义消息模板的邮件、短信、企业微信、钉钉、语音、HTTP或HTTPS形式通知指定的人员。如果您未创建任何消息模板,则采用默认消息模板。 创建消息模板 在左侧导航栏中选择“告警
条件时,系统根据关联SMN主题与消息模板来发送告警通知。 通过创建告警行动规则关联SMN主题与消息模板。 通过创建消息模板,自定义通知消息配置。 告警行动规则创建成功后,可在“告警> 告警降噪> 分组规则”中“创建分组规则”关联行动规则。 本功能当前在华北-北京一、华北-北京四、
集群监控 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。 注意事项
基础设施监控 通过helm部署pod的yaml文件后,AOM无法检测到工作负载
在“Grafana 数据源配置信息”区域,可以获取当前Prometheus实例下内网或公网的Grafana 数据源配置代码,在右侧单击可复制该代码到对应文件。 在“服务地址”区域,可以获取当前Prometheus实例下内网或公网的Prometheus 配置代码,在右侧单击可复制该代
少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可创建统计规则。统计规则创建成功后,AOM能够针对您配置的关键词周期性地进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。 目前对于华北-北京一、华东-上海二和华南-广州区域,统计规
告警规则 Prometheus监控Alerting Rule格式的告警配置。可以通过PromQL描述。 标签 描述指标的一组Key-Value值。 指标管理 Prometheus监控的功能特点之一,无需静态配置,可以自动发现采集目标。支持Kubernetes SD、Consul、
发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微
日志分析(旧版) 搜索日志 查看日志文件 配置虚机日志采集路径 添加日志转储 接入LTS 日志流
API 告警 监控 prometheus监控 日志 Prometheus实例 配置管理 UniAgent管理 应用资源管理(aom2.0接口) 自动化运维(aom2.0接口)
据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 SAP 监控 随着越来越多的SAP系
日志管理 日志管理使用说明 搜索日志 查看日志文件 添加日志桶 查看桶日志 添加日志转储 创建统计规则 接入LTS 容器日志采集配置
租户从IAM申请到的projectid,一般为32位字符串。 最小长度:32 最大长度:32 workflow_id 是 String 任务id,从工作流命令列表中获取的工作流id。 最小长度:1 最大长度:64 execution_id 是 String 任务执行id。 最小长度:1 最大长度:64
方法分析 方法分析支持检查正在运行的方法的耗时明细、调用来源以及方法源码。用于快速定位问题的根本原因,以及问题线下无法复现或日志缺失等场景。 方法分析 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。