检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
应用场景 AOM应用广泛,下面介绍AOM的两个典型应用场景,以便您深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。
AOM最佳实践汇总 本文汇总了应用运维管理(AOM,Application Operations Management)常见应用场景的操作实践,为每个实践提供详细的方案描述和操作指导,帮助用户轻松使用AOM。 表1 AOM 最佳实践一览表 最佳实践 说明 建设完整指标体系,实现立体化监控
高危命令说明 高危命令指影响系统或服务的正常运行,或造成系统特殊文件被恶意删除或修改命令。自动化运维服务涉及的高危命令请参见表1。 表1 高危命令说明 高危命令名称 高危命令校验规则 样例 导致风险 vi /etc/xxx.xx command \\s*(vi|vim)\\s+/
指标维度 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP
AOM自定义策略 如果系统预置的AOM权限不能满足您的授权要求,您可以创建自定义策略。自定义策略中可以添加的授权项(Action),请参考策略和授权项说明。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作
AOM自定义策略 如果系统预置的AOM权限不能满足您的授权要求,您可以创建自定义策略。自定义策略中可以添加的授权项(Action),请参考策略和授权项说明。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作
监控 “√”表示支持,“x”表示暂不支持。 表1 监控 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询时间序列 POST /v2/{project_id}/series aom:metric:list √ × 查询时序数据
什么是应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化
Web监控 AOM作为华为云服务可观测性分析统一入口,自身并不具有APM服务的功能,AOM 2.0控制台中Web监控相关功能由应用性能管理APM提供。用户可在AOM 2.0控制台界面操作,也可登录APM控制台界面操作。 Web监控功能当前仅在华东-上海一区域开放。 表1 功能说明
执行工作流 功能介绍 该接口可下发执行指定的任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/cms/workflow/{workflow_id}/executions 表1 路径参数 参数 是否必选 参数类型 描述 project_id
更新任务 功能介绍 更新定时任务的启停状态,可启动定时任务或停止定时任务,返回操作任务结果。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/cms/workflow/{workflow_id}/trigger/action 表1 路径参数 参数
对暂停中的任务进行操作 功能介绍 该接口可对任务进行失败重试、失败跳过、暂停继续操作,返回操作结果。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/cms/workflow/{workflow_id}/executions/{execution_id}/operation
容器组件指标及其维度 表1 容器指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_container_cpu_limit_core) 该指标用于统计测量对象限制的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_container_cpu_used_core)
查询绑定在节点上的资源列表 功能介绍 该接口用于查询绑定在节点上的资源列表。 调用方法 请参见如何调用API。 URI POST /v1/resource/{rf_resource_type}/type/{type}/ci-relationships 表1 路径参数 参数 是否必选
获取任务执行历史 功能介绍 该接口可获取执行任务的执行历史。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/cms/workflow/{workflow_id}/executions 表1 路径参数 参数 是否必选 参数类型 描述 project_id
获取工作流执行中的执行详情 功能介绍 该接口可获取任务的执行详情,可指定工作流ID和执行ID去查询对应的任务,返回任务执行详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/cms/workflow/{workflow_id}/execut
基本概念 本文汇总使用Prometheus监控过程中涉及的基本概念,方便您查询和了解相关概念。 表1 基本概念 概念 说明 Exporter 一个采集监控数据并通过Prometheus监控功能规范对外提供数据的组件。目前有上百个官方或者第三方 Exporter可供使用,具体请参见Exporter详情。
产品优势 表1 产品优势 开箱即用 一键安装部署即可监控Kubernetes以及各类云产品。 一键接入各种应用组件及告警工具。 低成本 多种指标免费用,覆盖Kubernetes标准组件。 提供全托管式服务,无需另购资源,可降低监控成本,且维护成本几乎为零。 与CCE集成并提供监控