检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将AOM资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用AOM服务的其它功能。
自动化运维(aom2.0接口) 创建任务 更新任务 对暂停中的任务进行操作 获取工作流执行中的执行详情 终止任务执行 脚本查询 脚本版本查询 作业管理主页模糊查询 根据作业id查询方案(自定义模板)列表 获取方案信息 查询任务列表 获取任务执行历史 执行工作流 父主题: API
定界应用与资源的问题。 优势 应用自动发现:自动部署采集器,针对应用的运行环境,主动发现应用并进行监控。 跨云服务的分布式应用监控:对于同时使用了多种云服务的分布式应用,提供统一的运维平台,便于您对业务进行立体排查。 告警灵活通知:提供多种异常检测策略并支持丰富的异常告警触发方式及API。
使用自动化运维资源。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将自动化运维资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用自动化运维服务的其它功能。
标、自定义指标除外)。 告警消息内容显示资源的TMS标签:用来控制告警通知的消息内容是否显示不同云资源的标签。 约束与限制 全局开关针对整个AOM 2.0服务生效。 开启“告警消息内容显示资源的TMS标签”开关后,在告警消息模板中配置的“TMS标签: $event.annotations
通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 系统支持创建的阈值规则和事件类告警规则总计不能超过1000条,即创建的告警规则数量不能超过1000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。 父主题: 告警规则(新版)
您需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“主机组管理”功能。 表1 功能说明 功能名称 功能说明 AOM 2.0控制台入口 LTS控制台入口 参考文档链接 主机组管理 主机组是为了便于分类管理、提升配置多个主机日志采集的效率,对主机进行虚拟分组的单位。云日志服务
您需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“主机组管理”功能。 表1 功能说明 功能名称 功能说明 AOM 2.0控制台入口 LTS控制台入口 参考文档链接 主机组管理 主机组是为了便于分类管理、提升配置多个主机日志采集的效率,对主机进行虚拟分组的单位。云日志服务
术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
服务指标及其维度 服务指标是由实例指标汇聚而来的,其指标维度与实例指标维度相同。 实例指标详见:实例指标及其维度。 父主题: 指标总览
UniAgent:UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座,为AOM提供指令下发,如脚本下发和执行,用于插件集成(ICAgent、CES、telescope等)并维护其状态。UniAgent对外功能主要是为AOM服务提供中间件指标采集和自定义指标采集的能力。 Un
”字段的值。 如果2为空,则取环境变量“PAAS_MONITORING_GROUP”的值。 如果3为空,则取进程的启动命令中“DAOM.APPN”字段的值。 组件名称取值优先级: 取进程的启动命令中“DAOM.PROCN”字段的值,如果为空则取“Dapm_tier”字段的值。 如
”字段的值。 如果2为空,则取环境变量“PAAS_MONITORING_GROUP”的值。 如果3为空,则取进程的启动命令中“DAOM.APPN”字段的值。 组件名称取值优先级: 取进程的启动命令中“DAOM.PROCN”字段的值,如果为空则取“Dapm_tier”字段的值。 如
prometheus监控 GET方法查询区间数据 (推荐)POST方法查询区间数据 GET方法查询瞬时数据 (推荐)POST方法查询瞬时数据 查询标签值 GET方法获取标签名列表 (推荐)POST方法获取标签名列表 元数据查询 父主题: API
此卡片主要展示了3种信息: 统计最新时间前1分钟内的主机的磁盘读/写速率在TOP5的主机信息。 最近1小时内的所选主机的磁盘读/写速率的趋势图,趋势图的每一个点分别表示1分钟内主机的磁盘读/写速率的值。 趋势图上方的值为所选主机的磁盘监控的最新时间点主机的磁盘读/写速率的值。 主机监控(网络)卡片 图8
监控 查询时间序列 查询时序数据 查询指标 查询监控数据 添加监控数据 添加或修改服务发现规则 删除服务发现规则 查询系统中已有服务发现规则 添加阈值规则 查询阈值规则列表 修改阈值规则 删除阈值规则 查询单条阈值规则 批量删除阈值规则 父主题: API
获取告警行动规则列表 查询指标类或者事件类告警规则列表 添加或修改指标类或事件类告警规则 删除指标类或事件类告警规则 删除告警规则模板 查询告警规则模板列表 查询消息通知模板列表 删除消息通知模板 新增消息通知模板 修改消息通知模板 根据消息通知模板名称查询消息通知模板 父主题:
√ 瞬时数据查询 GET /v1/{project_id}/aom/api/v1/query aom:metric:list √ √ 瞬时数据查询 POST /v1/{project_id}/aom/api/v1/query aom:metric:list √ √ 查询标签值 GET
企业项目(Enterprise Project) 查询时间序列 POST /v2/{project_id}/series aom:metric:list √ × 查询时序数据 POST /v2/{project_id}/samples aom:metric:list √ × 查询指标 POST /v1/{