检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 在菜单栏的“全部企业项目”的下拉列表中,选择企业项目。 图2 企业项目 父主题: 应用资源管理
引起业务的异常。 事件是告诉您AOM自身,或ServiceStage、CCE等外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您不用对事件进行处理。 父主题: 告警管理
公共请求消息头 表1 公共请求消息头 名称 描述 是否必选 示例 X-Auth-Token 用户Token。 使用Token认证时必选 - Content-Type 内容类型。 该字段内容填为“application/json;charset=utf8”。 必选 applicat
DELETE /v1/applications/{application_id} 表1 路径参数 参数 是否必选 参数类型 描述 application_id 是 String 应用id 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
的异常。 事件是告诉您AOM自身,或AOS、ServiceStage、CCE等外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您不用对事件进行处理。 父主题: 常见咨询问题
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
URI PUT /v1/environments/{environment_id} 表1 路径参数 参数 是否必选 参数类型 描述 environment_id 是 String 环境id 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
/v1/{project_id}/aom/prometheus 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户从IAM申请到的projectid,一般为32位字符串。 表2 Query参数 参数 是否必选 参数类型 描述 prom_id
使用Token前请确保Token离过期有足够的时间,防止调用API的过程中Token过期导致调用API失败。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限。
ICAgent版本说明 表1 ICAgent版本说明 版本号 说明 5.12.135 解决CPU使用率为0的问题 解决CCE1.23版本集群containerd节点容器网络指标缺失问题 支持采集EulerOS 2.5系统的磁盘分区指标 5.12.133 容器的标准输出日志支持多行采集。
在左侧导航栏中选择“作业管理”,单击右上角的“新建作业”。 设置“添加全局参数”,创建参数类型为“字符串”的参数 param1, 创建参数类型为“主机列表”的参数param2,并保存。 创建作业步骤,如创建脚本执行步骤时,可在“脚本参数”中通过 ${param1} 引用字符串参数,可在选择“目
最小长度:0 最大长度:255 响应参数 状态码: 400 表3 响应Body参数 参数 参数类型 描述 error_code String AOM.30005001 error_msg String 参数错误 状态码: 403 表4 响应Body参数 参数 参数类型 描述 error_code
total 写入花费的总时长 node_nf_conntrack_entries 链接状态跟踪表分配的数量 node_nf_conntrack_entries_limit 链接状态跟踪表总量 node_processes_max_processes PID限制值 node_processes_pids
集群指标及其维度 集群指标由AOM通过主机指标汇聚,汇聚的集群指标不包含master节点的主机指标。 表1 集群指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_cluster_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core)
CONSOLESERVICE_DISCOVERY 响应参数 状态码: 400 表3 响应Body参数 参数 参数类型 描述 error_code String AOM.30005001 error_msg String 参数错误 状态码: 403 表4 响应Body参数 参数 参数类型 描述 error_code
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。
/rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户从IAM申请到的projectid,一般为32位字符串。 prometheus_instance 是 String prometheus实例id。 请求参数 表2 请求Header参数
需配置应用发现规则。 配置日志采集路径(可选) 如果您需使用AOM监控主机的日志,则需配置日志采集路径。 运维(可选) 您可使用AOM的仪表盘、告警通知等功能进行日常运维。
0控制台界面操作,也可登录LTS控制台界面操作。 您需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“主机组管理”功能。 表1 功能说明 功能名称 功能说明 AOM 2.0控制台入口 LTS控制台入口 参考文档链接 主机组管理 主机组是为了便于分类管理、提升配置多