检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
步骤的类型,包括:脚本管理,文件管理和暂停步骤三种类型。 步骤说明 步骤说明信息,最多可输入1000个字符。 超时时长 脚本安装/卸载任务超时时长,输入值必须在1到43200之间。 执行账号 选择执行脚本的OS账号名称。 目标实例 全局参数,选择主机列表参数。 手动添加,根据手动选择和从CMDB中选择ECS实例。
服务场景 服务场景概述 启动ECS实例 关闭ECS实例 重启RDS实例 修改ECS非管理员密码 重启CCE工作负载 清理磁盘空间 父主题: 运维管理
配置指标存储时长 本节介绍如何配置云服务、ECS、CCE、 多账号聚合实例、APM、通用实例与default类型Prometheus实例的指标存储时长。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 约束与限制 当前配置指
了达到多步骤参数共享目的,可清晰的看到整个流程涉及的全部参数和用途。 OS账号 用于执行脚本和文件管理的操作系统账户。 工具市场 服务默认提供的按照场景分类展现各功能的工具卡片,用户可根据需要控制场景从服务市场中上下架和基于安全考虑配置任务的审批流程。 父主题: 基本概念
云服务场景 云服务场景展现启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载已上架的工具卡片。可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作,具体操作参见启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载。
配置管理 ICAgent管理(华为云主机) ICAgent管理(非华为云主机) 接入管理 日志配置 配额设置 指标配置 数据订阅
资源接入AOM 安装ICAgent(华为云主机) 安装ICAgent(非华为云主机) ICAgent版本说明 配置应用发现规则 配置日志采集路径
计费云服务:除Modelarts/IotDA/IEF/CSE以外,其它云服务接入Prometheus实例后均会产生计费。 ECS场景 在ECS场景自建中间件,会产生计费。 在ECS场景安装Node Exporter,部分指标会产生计费。 其它可能场景 除几类基础指标以外,其它指标上报到AOM均可能产生计费。
配置参数库 “参数库”页面展示现有所有参数信息,您可以在这里创建参数,也可以修改、删除已创建的参数。修改ECS非管理员密码,创建作业等多种场景下,可应用已创建的参数来快速设置用户密码、全局参数等信息。每个用户最多创建25个参数。 创建参数 登录AOM 2.0控制台。 在左侧导航栏
行处理,处理完成后再发送通知,避免产生告警风暴。 告警规则:通过创建告警或事件规则,实时监控资源使用情况。 查看告警或事件:提供告警和事件的查询和处理功能,便于您更快地发现、定位并恢复故障。 约束与限制 当前部分区域的“告警管理”菜单名称更名为“告警中心”,“告警行动规则”菜单名称更名为“告警通知”。
了解更多常见问题、案例和解决方案 常见使用问题 如何区分告警和事件? 怎样查看AOM中的日志是通过哪个应用产生的? 如何区分Prometheus监控功能采集的基础指标和自定义指标数据? ICAgent和UniAgent是同一个插件吗? ECS主机上执行UniAgent安装命令,下载安装脚本失败
XX小时:间隔XX小时检查一次查询和分析结果。 XX分钟:间隔XX分钟检查一次查询和分析结果。 XX秒:间隔XX秒检查一次查询和分析结果。 检查频率可以设置为15秒或30秒以实现秒级监控。指标告警的时效性取决于指标上报周期、规则检查频率及通知发送耗时。 例如,指标上报周期为15秒,规
String 应用id create_time String 创建时间 creator String 创建者 description String 描述 id String 组件Id modified_time String 修改时间 modifier String 修改者 name String
create_time String 创建时间 creator String 创建人 description String 描述 display_name String 应用名称 eps_id String 企业项目id modified_time String 修改时间 modifier String
描述 aom_id String aomId component_id String 组件Id create_time String 创建时间 creator String 创建者 description String 描述 env_id String 环境Id env_name
该指标用于统计http2总请求数。 ≥0 个 envoy_http_downstream_rq_idle_timeout 空闲时间超时关闭请求数 该指标用于统计因空闲时间超时的请求数。 ≥0 个 envoy_http_downstream_rq_too_large 请求体过大请求数 该指
设置为秒级别的时间,便于告警合并后再发送,避免告警风暴。 15秒 变化等待 合并集合内的告警数据发生变化后,等待多久发送告警通知。此处的变化是指新增告警或告警状态改变。 60秒 重复等待 合并集合内的告警数据重复后,等待多久发送告警通知。此处的重复是指无新增告警和状态变化,仅其他属性(例如标题、内容等)改变。
required_matchers: [ <labelname>: <labelvalue> ... ] # remote read 查询超时时间 [ remote_timeout: <duration> | default = 1m ] # 自定义 remote read 请求中附带的
create_time String 创建时间 creator String 创建人 description String 描述 display_name String 应用名称 eps_id String 企业项目id modified_time String 修改时间 modifier String
描述 aom_id String aomId component_id String 组件Id create_time String 创建时间 creator String 创建者 description String 描述 env_id String 环境Id env_name