检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将AOM资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用AOM服务的其它功能。
自动化运维(aom2.0接口) 创建任务 更新任务 对暂停中的任务进行操作 获取工作流执行中的执行详情 终止任务执行 脚本查询 脚本版本查询 作业管理主页模糊查询 根据作业id查询方案(自定义模板)列表 获取方案信息 查询任务列表 获取任务执行历史 执行工作流 父主题: API
通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 系统支持创建的阈值规则和事件类告警规则总计不能超过1000条,即创建的告警规则数量不能超过1000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。 父主题: 告警规则(新版)
应用资源管理(aom2.0接口) 新增应用 删除应用 查询应用详情 修改应用 新增组件 删除组件 查询组件详情 修改组件 创建环境 删除环境 查询环境详情 修改环境 查询绑定在节点上的资源列表 根据应用名称查询应用详情 根据环境名称查询环境详情 根据组件名称查询组件详情 新增子应用 删除子应用 修改子应用
使用自动化运维资源。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将自动化运维资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用自动化运维服务的其它功能。
服务指标及其维度 服务指标是由实例指标汇聚而来的,其指标维度与实例指标维度相同。 实例指标详见:实例指标及其维度。 父主题: 指标总览
术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“主机组管理”功能。 表1 功能说明 功能名称 功能说明 AOM 2.0控制台入口 LTS控制台入口 参考文档链接 主机组管理 主机组是为了便于分类管理、提升配置多个主机日志采集的效率,对主机进行虚拟分组的单位。云日志服务
术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
代理区域管理 为解决多云之间网络互通,需要在华为云购买和配置ECS主机为代理机,同时代理机上需要绑定公网IP,AOM通过该代理机下发部署控制命令到远程主机,运维数据也将经过该代理机至AOM。代理区是由多个代理机组成,主要是考虑代理机高可用。 代理区域 代理机 父主题: 采集设置
”字段的值。 如果2为空,则取环境变量“PAAS_MONITORING_GROUP”的值。 如果3为空,则取进程的启动命令中“DAOM.APPN”字段的值。 组件名称取值优先级: 取进程的启动命令中“DAOM.PROCN”字段的值,如果为空则取“Dapm_tier”字段的值。 如
”字段的值。 如果2为空,则取环境变量“PAAS_MONITORING_GROUP”的值。 如果3为空,则取进程的启动命令中“DAOM.APPN”字段的值。 组件名称取值优先级: 取进程的启动命令中“DAOM.PROCN”字段的值,如果为空则取“Dapm_tier”字段的值。 如
aom:cmdbEnvironment:update √ × 查询绑定在节点上的资源列表 POST /v1/resource/{rf_resource_type}/type/{type}/ci-relationships aom:cmdbResources:list √ × 查询应用详情 GET /v1/applications
UniAgent:UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座,为AOM提供指令下发,如脚本下发和执行,用于插件集成(ICAgent、CES、telescope等)并维护其状态。UniAgent对外功能主要是为AOM服务提供中间件指标采集和自定义指标采集的能力。 Un
此卡片主要展示了3种信息: 统计最新时间前1分钟内的主机的磁盘读/写速率在TOP5的主机信息。 最近1小时内的所选主机的磁盘读/写速率的趋势图,趋势图的每一个点分别表示1分钟内主机的磁盘读/写速率的值。 趋势图上方的值为所选主机的磁盘监控的最新时间点主机的磁盘读/写速率的值。 主机监控(网络)卡片 图8
× 对暂停中的任务进行操作 POST /v1/{project_id}/cms/workflow/{workflow_id}/executions/{execution_id}/operation cms:execution:create √ × 获取工作流执行中的执行详情 GET
全局开关 “指标采集开关”用来控制是否对指标数据进行采集(SLA指标、自定义指标除外)。“告警消息内容显示资源的TMS标签”开关用来控制告警通知的消息内容是否显示不同云资源的标签。该权限设置针对整个AOM 2.0服务生效。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。
prometheus监控 GET方法查询区间数据 (推荐)POST方法查询区间数据 GET方法查询瞬时数据 (推荐)POST方法查询瞬时数据 查询标签值 GET方法获取标签名列表 (推荐)POST方法获取标签名列表 元数据查询 父主题: API
监控 查询时间序列 查询时序数据 查询指标 查询监控数据 添加监控数据 添加或修改服务发现规则 删除服务发现规则 查询系统中已有服务发现规则 添加阈值规则 查询阈值规则列表 修改阈值规则 删除阈值规则 查询单条阈值规则 批量删除阈值规则 父主题: API
API模块、PromQL查询。 静态文件配置和动态发现机制发现监控对象,实现轻松迁移及接入。 数据规模无上限 凭借云存储能力,数据存储无上限,不再受限于本地容量。云端分布式存储保障数据可靠性。 通过Prometheus实例 for 多账号聚合实例将多个资源账号的指标数据汇聚到一个Prometheus实例,实现统一监控。