检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
运行环境接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,支持运行环境接入AOM。即可将CCE 、CCI容器指标和ECS虚机指标上报到AOM。 配置运行环境接入AOM 登录AOM 2.0控制台。 在左侧导航栏中选择“接入 > 接入中心”,进入接入中心页面。(如果
本,且购买后需要给主机安装ICAgent,否则AOM将无法监控)。同时,主机的IP地址支持IPv4。 通过主机监控功能您可以及时了解主机的资源使用情况、趋势和告警信息,使用这些信息,您可以快速响应和处理异常,保证主机流畅运行。 约束与限制 一个主机最多可添加5个标签,且标签键不能重复。
project_id 是 项目ID 请求消息 请求消息头 请求消息头如表2所示。 表2 请求消息头 参数 描述 是否为必选 示例 ResourceType 资源类型 必选 默认值为app,app表示给应用修改策略组属性 Cluster-Id 集群ID 必选 - Namespace 命名空间 必选 -
界面查看AOM仪表盘图表页面。 通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。
规则。 查看告警 在已设的监控周期内,当某个资源或资源的指标数据满足告警条件时,产生对应的告警。 可在左侧导航栏中选择“告警管理 > 告警列表”,在“告警”页签下查看该告警,具体请参见查看告警。 查看事件 在已设的监控周期内,当某个资源没有指标数据上报时,会产生一条数据不足的事件。
主机指标及其维度 表1 主机指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_node_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。
设置内网连通配置。 选择终端节点服务。请从下拉列表选择合适的终端节点服务。 选择的终端节点服务需要和自建Prometheus是同一个VPC。目前仅支持后端资源类型为云服务器、弹性负载均衡类型的终端节点服务。 添加白名单权限。 单击“一键添加至白名单”将AOM提供的账号ID,添加至终端节点服务的白名单中。
"Request param is invalid", "trace_id" : "" } 状态码: 404 NotFound 所请求的资源不存在。建议直接修改该请求,不要重试该请求。 { "errorCode" : "SVCSTG.INV.4040000", "errorMessage"
名称自动获取。 脚本参数框后的“敏感参数”,勾选后脚本参数框对输入的内容不直接显示。 图4 配置脚本执行任务 选择“目标实例”。单击“添加资源”,弹出选择实例页面。实例类型默认为“ECS”。选择方式默认采用“手动选择”方式,选择方式的详细说明请参见表4。 表4 选择方式说明 选择方式
标数据均上报到AOM分析处理,日志数据则只能匹配系统中最新的日志采集配置。 例如,当前在AOM中配置了ECS主机的日志采集路径,则之前在该资源集下,LTS中所有ECS主机的采集配置都失效。 ICAgent状态说明详见下表。 表1 ICAgent状态 状态 说明 运行 该主机ICAgent运行正常。
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。
kube_node_spec_unschedulable 节点是否可调度 kube_node_status_allocatable 节点可分配资源 kube_node_status_capacity 节点资源总量 kube_node_status_condition 节点状态condition kube_node_
None 操作指导 应用运维管理 AOM 创建告警规则(按全量指标创建) 03:45 创建告警规则(按全量指标创建) 应用运维管理 AOM 创建告警规则(按Prometheus命令创建) 04:08 创建告警规则(按Prometheus命令创建) 应用运维管理 AOM 通过虚机接入方式接入中间件指标
运维管理(即将下线) 安装文件包提示没有OBS权限怎么办? 定时任务无法成功触发 编排好的作业,能否在执行时再选择执行机,填入脚本参数等内容? 使用cron表达式创建定时任务,提示参数错误 如何为执行方案配置审批? 执行清理磁盘任务时,提示 delete success:{},未成功删除已选择目录下的文件
resource_provider:事件对应云服务名称。类型为String; resource_type:事件对应资源类型。类型为String; resource_id:事件对应资源信息。类型为String。 metadata中的value长度为1到2048字符串。 annotations
管理主机的UniAgent UniAgent安装成功后,支持对主机的UniAgent进行重装、升级、卸载和删除操作。 约束与限制 如果通过旧版方式安装UniAgent的主机是Windows操作系统,需在主机上手动执行重装UniAgent操作。 UniAgent暂时不提供自动升级,而是根据您的需求自主进行升级。
管理主机的UniAgent UniAgent安装成功后,支持对主机的UniAgent进行重装、升级、卸载和删除操作。 约束与限制 如果通过旧版方式安装UniAgent的主机是Windows操作系统,需在主机上手动执行重装UniAgent操作。 UniAgent暂时不提供自动升级,而是根据您的需求自主进行升级。
安装UniAgent 统一数据采集Agent(简称UniAgent)完成统一插件生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集,可在接入中心安装对应的插件,并创建采集任务,来进行指标数据采集。 AO
安装UniAgent 统一数据采集Agent(简称UniAgent)完成统一插件生命周期管理,并为AOM提供指令下发功能,如脚本下发和执行。UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集,可在接入中心安装对应的插件,并创建采集任务,来进行指标数据采集。 AO
输入脚本参数、超时时长、执行账号,也可以勾选“敏感参数”,勾选后脚本参数框对输入的内容不直接显示。 图3 脚本参数 选择“目标实例”。 单击“添加资源”,弹出选择实例页面。 实例类型默认为“ECS”。选择方式默认采用“手动选择”方式,选择方式的详细说明请参见表2。 图4 添加实例 表2 选择方式说明