检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
升级失败 主机ICAgent升级失败,请登录服务器卸载后重新安装。 离线 AK/SK配置不正确或30200、30201端口未连通,处理操作详见如何处理界面“ICAgent状态”为“离线”的问题。 异常 主机ICAgent功能异常,请联系技术人员处理。 可能原因二:AOM不支持监控当前资源类型
strings 属性列表(暂不使用,可不传)。 cmdLine、env detectLog 是 String 是否开启日志采集。 true、false discoveryRule 是 Array of DiscoveryRule objects 规则发现部分,数组中有多个对象时表示需要同时满足
在“账号接入”界面可以管理成员账号、接入云服务、选择数据存储,并添加云服务支持的相关指标。 管理成员账号:AOM为企业用户提供多账号关系的管理能力,支持用户将多个华为云账号整合到创建的组织中,并可以集中管理组织下的所有账号。组织下有三种成员类型,分别为组织管理员、委托管理员和普通用户。普通用户无权限在AOM监控多账号指标。
Prometheus监控功能采集的指标数据,如何区分基础指标和自定义指标? 用户可以登录AOM控制台,进入Prometheus实例的详情界面,通过查看Prometheus监控功能采集的指标数据类型,区分基础指标和自定义指标。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控
Service)提供简单方便的镜像自助管理功能。用户可以灵活便捷地使用公共镜像、私有镜像或共享镜像申请云服务器。同时,用户还能通过已有的云服务器或使用外部镜像文件创建私有镜像。 在Linux环境打包镜像 用户在Linux环境下,可以使用以下打包镜像的方式。 前提条件 打包镜像的Linux机器
动被发现;对于不满足内置应用发现规则的应用,您则需配置应用发现规则。 配置日志采集路径(可选) 如果您需使用AOM监控主机的日志,则需配置日志采集路径。 运维(可选) 您可使用AOM的仪表盘、告警通知等功能进行日常运维。
该指标用于统计测量对象的显存容量。 ≥0 兆字节(MB) gpuMemUsage gpuMemUsage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) gpuMemUsed gpuMemUsed 显存使用量 该指标用于统计测量对象已使用的显存。
ge) 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) 显存已使用量(aom_cluster_gpu_memory_used_megabytes) 该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) GPU使用率(aom_cluster_gpu_usage)
集群监控 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。 注意事项
手动升级 引导用户如何将AOM 1.0 的数据迁移至AOM 2.0 ,目前仅支持日志升级、采集器升级和告警规则升级功能。 功能介绍 日志升级 日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。
手动升级 引导用户如何将AOM 1.0 的数据迁移至AOM 2.0 ,目前仅支持日志升级、采集器升级和告警规则升级功能。 功能介绍 日志升级 日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。
时获取资源运行状态等信息并采取相应措施,避免因资源问题造成业务损失。SMN-价格说明 日志转储:依赖对象存储服务(简称OBS),将日志文件转储到OBS桶中,以便进行长期存储。OBS-价格说明 日志订阅和阈值告警订阅:依赖分布式消息服务Kafka版,发送日志或阈值告警数据到Kafk
及其以上版本,上表所列的其他操作系统对应版本均支持。 资源使用限制 在使用AOM时,您需注意以下使用限制,详见表2。使用限制中部分内容属于配额,关于什么是配额以及怎样查看与修改配额,详见关于配额。 表2 资源使用限制 分类 对象 使用限制 仪表盘 仪表盘 1个区域中最多可创建50个仪表盘。
$event.annotations.key2 表3 配置日志消息模板参数 参数名称 说明 校验规则 样例 主题 消息的主题 支持自定义主题名称和使用变量命名主题两种方式。主题名称长度不能超过512个字符。 仅邮件类型支持配置消息主题。 test 正文 消息的内容 添加变量: 规则原始名称:${event_name}
errorMessage String 响应信息描述。 responseStatus Integer 响应状态码(不再使用)。 id Array of strings 服务发现规则id列表,多AZ配置同步时使用。 请求示例 删除应用发现规则ID为“b788349e-62b2-xxxx-xxxx-02c611d59801”的服务发现规则。
安装文件包提示没有OBS权限怎么办? 问题描述 安装文件包提示没有OBS权限。 可能原因 自动化运维需要访问凭证授权访问OBS,用来获取OBS中的文件包。 解决方法 请在左侧导航栏单击“自动化运维(日落)”,进入“设置 > 访问凭证”页面,检查是否已创建访问凭证,如果没有创建访问凭证,请新建访问凭证。
完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。 应用: 一个完整的业务模块,由多个组件组成。 在配置完应用发现之后,可以使用AOM监控应用的各项指标,关联应用对应的资源告警等,主要特性与场景如下: 提供应用与组件、组件与组件实例、应用与主机的关联关系。 提供组件与日志的关联搜索能力。
对OBS桶中数据的操作。云审计服务管理控制台会保存最近7天的操作记录。 本节介绍如何在云审计服务管理控制台查看或导出最近7天的操作记录: 在新版事件列表查看审计事件 在旧版事件列表查看审计事件 使用限制 单账号跟踪的事件可以通过云审计控制台查询。多账号的事件只能在账号自己的事件列
查询Prometheus实例 功能介绍 该接口用于查询Prometheus实例。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/prometheus 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
线程分析展示:线程名称,CPU使用率以及线程数量。 支持按照NEW、BLOCKED、WAITING、TIMED_WAITING、TERMINATED、RUNNABLE分类,分别展示对应的耗时信息以及数量。 单击线程名称前,展示该线程分析信息,包括:线程名称,线程ID,CPU使用率,状态以及操作。