检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看AOM告警或事件 “告警列表”页面提供告警和事件的查询和处理功能,便于您更快地发现、定位并恢复故障。 功能介绍 在告警列表中,有以下关键功能: 告警列表:支持按告警级别图形化查看告警信息。 高级过滤:支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。
开通AOM 开通AOM前请先注册华为账号并完成实名认证。 开通AOM 开通AOM时,因为不同区域是互相隔离的,对于不同的区域(例如:华北-北京一、华南-广州等),您需切换区域后分别进行开通操作。 操作步骤如下: 登录华为云管理控制台。 在左上角单击,在下拉列表中选择操作区域。 单击左侧,选择“管理与监管
在弹出的“创建AccessCode”对话框中单击“立即生成”,系统自动为当前用户生成AccessCode。 AccessCode是调用API的身份凭据,每个项目最多可创建2个AccessCode,请您妥善保管。 获取Grafana 数据源配置代码。 登录AOM 2.0控制台。
没有正确安装UniAgent。 UniAgent为非“运行中”状态。 解决方法 检查UniAgent的状态,UniAgent状态有运行中、异常、安装中、安装失败和未安装,若UniAgent为非“运行中”状态,请分别按照以下方法解决: 异常:表示主机安装的UniAgent功能异常,请联系技术支持。
naming ip个数 微服务注册实例数。 ≥0 个 nacos_serviceSubscriberCount Nacos naming订阅者数量 Nacos naming订阅者数量。 ≥0 个 nacos_serviceCount Nacos naming域名个数(2.x 版本) Nacos集群内各节点的服务个数。
支持自定义消息模板和多种通知渠道(邮件、短信、语音、企业微信、钉钉、飞书、Webhook)。 统一监控大盘:支持自定义可视化监控大盘,提供表格、折线图、饼图、地图等多种可视化图表,预置30+开箱即用仪表盘。用户可以添加自定义变量和过滤器筛选数据,方便对指标和日志数据进行可视化运营分析。
原因。 图4 TopN接口错误率突增 应用服务整体流量不均:基于应用下所有实例的流量数据,展示应用下最大流量和最小流量实例的流量和时延数据,并展示应用下流量Top5的接口在最大流量和最小流量实例上的分布,快速定位受影响接口。单击所展示的接口,可详细追踪接口近期的调用情况。 图5 应用服务整体流量不均
基础指标免费,自定义指标收费,按照指标上报量进行计费。 CCI实例监控 按需计费 秒级监控指标数量 按需计费 自定义指标 按需计费 查询指标数据API调用 按需计费 免费 事件和告警总条数 按需计费 免费 指标存储量 7天内免费 15天内免费 数据转储量 免费 按需计费
格式为:{ip:port}/{path}。例如: 192.168.0.1:9090/api/v1/write 鉴权方式 访问用户侧Prometheus的认证方式。 基础认证:输入用户侧自建Prometheus的用户名和密码。 Token:输入访问用户侧自建Prometheus的Token。
支持通过日期对历史任务进行过滤查询。选择的日期有近1小时、近6小时、近1天、近3天和自定义时间。自定义时间最多可查询半年内的历史任务。 单击任务ID,进入任务详情页面,并单击操作列的“查看日志”,查看插件操作日志详情。 其他相关操作 在操作日志页面中,您可以对历史任务进行如下相关操作,具体的操作有: 表1 相关操作
工作负载监控是针对CCE、CCI工作负载的监控,通过工作负载监控您可以及时了解工作负载的资源使用、状态和告警等信息,以便快速响应处理告警或事件信息,保证工作负载顺畅运行。工作负载分为五种类型:无状态负载 Deployment、有状态负载 StatefulSet、守护进程 DaemonSet、普通任务Job、容器组
TopN接口平均响应时间突增:默认对流量Top 5的接口进行检测,基于接口历史3小时数据,判断最近10分钟Top 5接口平均响应时间是否有异常突增点。 应用服务整体错误率突增:基于应用历史3小时数据,判断最近10分钟应用服务整体错误率是否有异常突增点。 TopN接口错误率突增:默认对流量Top
支持通过日期对历史任务进行过滤查询。选择的日期有近1小时、近6小时、近1天、近3天和自定义时间。自定义时间最多可查询半年内的历史任务。 单击任务ID,进入任务详情页面,并单击操作列的“查看日志”,查看插件操作日志详情。 其他相关操作 在操作日志页面中,您可以对历史任务进行如下相关操作,具体的操作有: 表1 相关操作
U、物理内存、文件系统等信息。 在“相关资源”页签下,可按节点和节点名称、工作负载和负载名称、容器和容器名称查看当前容器组下的节点、工作负载、容器。 在左侧导航栏选择“洞察 > 容器 ”,可查看该集群的所有容器状态和资源使用情况。 在容器列表上方,可按容器名称设置过滤条件,实现容器过滤显示。
不可删除与编辑。 除默认模板的消息字段外,消息模板还支持用户自定义字段,需用户在上报事件告警信息时在指定参数上传该字段,具体实现参考接口文档:API事件告警,对应参数见下方消息模板告警上报结构体。 自定义字段支持以JSONPath的方式取值,示例:$event.metadata.case1、$event
功能说明 功能名称 功能说明 AOM 2.0控制台入口 LTS控制台入口 参考文档链接 接入管理 接入管理功能支持ICAgent采集、云服务、API接入、SDK接入等日志采集方式,采集日志后,日志数据可以在控制台界面以简单有序的方式展示、方便快捷的方式进行查询。 登录AOM 2.0控制台。
CCE的指标为例,需要提前在CCE中购买集群和节点,详细请参考购买Standard/Turbo集群和创建节点。如果您已有可用的集群和节点,可重复使用,不需要再次购买。 首次开通AOM 2.0并授权 注册账号并实名认证。 使用AOM 2.0前,需要先注册一个华为账号并进行实名认证。如果您已有一个华为账号,可直接跳过如下操作。
够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。同时,AOM开放统一API,支撑对接自研监控系统或者报表系统。AOM并非传统监控,它通过应用的角度看业务,满足企业对业务的高效和快速迭代的需求,可帮助企业实现 IT 对业务的有效支撑,保护、优化IT资产投资,使企业
重启CCE工作负载 使用重启CCE工作负载卡片可以创建任务重启一个或多个CCE工作负载。 只支持对有状态负载和无状态负载进行重启,其余类型负载不支持。 创建重启CCE工作负载任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在
管理指标接入和日志接入 在接入中心完成指标接入AOM以及日志接入LTS后,您可以在接入管理页面管理相关的指标接入规则和日志接入规则。 约束与限制 接入管理功能区分新旧版,如果您进入的是旧版接入管理页面,需使用新版接入管理功能,可在“接入中心”页面右上角单击“体验新版”,切换为新版