检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开通智能洞察 AOM智能洞察引擎持续监控您的应用和资源,通过历史数据和问题特征发现问题,并针对每个问题会给出相应的根因分析和建议。 功能介绍 事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。
0控制台界面操作,也可登录LTS控制台界面操作。 约束与限制 需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“接入管理”功能。 如果需要在AOM控制台中使用LTS的功能,需要提前获取LTS的相关权限,详情请参见LTS权限管理。 表1 功能说明 功能名称 功能说明 AOM
”,从默认提供的CCE模板中选择合适的模板,系统会根据选择的模板自动填充相关指标的普罗格式命令行。 单击告警规则详情后的,可以锁定告警规则详情中的内容。锁定后,您可以进行以下操作: 单击告警规则详情后的,解除锁定。 单击告警规则详情后的,复制普罗语句。 命令行输入的详细说明请参见普罗语句说明。
通过全局拓扑图查看应用间调用关系 拓扑图的每根线条代表服务之间一段时间的调用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图线条,可以查看该调用关系的趋势图;同时拓扑图也会展示中间件的调用关系。通过拓扑图,一方面可以自动梳理服务之间的调用关系,同时也可以从全局视角查看服务
术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
了托管式的CCE类型Prometheus实例 ,适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。CCE Prometheus实例默认提供对容器服务CCE集群的Prometheus云原生监控插件的集成。为CCE集群安装云原生监控插件后,指标将自动上报指标到指定的CCE Prometheus实例中。
您需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“主机组管理”功能。 表1 功能说明 功能名称 功能说明 AOM 2.0控制台入口 LTS控制台入口 参考文档链接 主机组管理 主机组是为了便于分类管理、提升配置多个主机日志采集的效率,对主机进行虚拟分组的单位。云日志服务
您需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“主机组管理”功能。 表1 功能说明 功能名称 功能说明 AOM 2.0控制台入口 LTS控制台入口 参考文档链接 主机组管理 主机组是为了便于分类管理、提升配置多个主机日志采集的效率,对主机进行虚拟分组的单位。云日志服务
oaded JobManager自JVM启动以来加载的类的总数。 无 flink_jobmanager_Status_JVM_ClassLoader_ClassesUnloaded JobManager自JVM启动以来卸载的类的总数。 无 flink_taskmanager_St
术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
AOM提供告警监控能力。告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,需要您采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。事件是指AOM自身或外部服务发生了某种变化,但不一定会引起业务异常情况下上报的信息,您可根据需要对事件进行处理。 功能说明 告警行动
iotda_device_status_totalCount 设备总数 统计租户在当前实例/资源空间下的总的设备数量 ≥0 个 iotda_device_status_offlineCount 离线设备数 统计租户在当前实例/资源空间下的离线的设备数量 ≥0 个 iotda_device_status_abnormalCount
运维通道的能力,提供批量脚本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重复繁杂的应用变更操作中解脱出来,提升运维操作的质量和效率,帮助企业运维转型和运维价值提升。
填写规则的描述信息。 图1 设置告警基本信息 设置告警规则的详细信息。 设置“规则类型”为“事件类告警”。 设置告警来源、触发对象和触发策略。 表1 告警规则填写说明 参数名称 填写说明 告警来源 事件类告警来源的服务名称,从现有的服务列表中选择。 触发对象 服务事件的筛选条件。
标。 需要监控某个成员账号的指标,则单击“成员账号”文本框,在弹出的搜索框中输入账号关键字,下面的账号树中自动显示相关的成员账号,根据需要勾选需要监控的成员账号即可。 需要停止监控某个成员账号的指标,则在“账号接入”界面的“成员账号”文本框中删除对应的成员账号。 接入云服务:从云
r”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 采集规则YAML配置样例如下,样例的指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标: apiVersion: monitoring
SDK概述 本文介绍了AOM服务提供的SDK语言版本,列举了最新版本SDK的获取地址。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 SDK列表 表1提供了AOM服务支持的SDK列表,您可以在GitHub仓库查看
中“全部实例”的“URL监控”信息。 图1 接口调用 在接口调用页签选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如
} else { fmt.Println(err) } } 更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 请求响应成功,返回执行方案列表。 400 BadRe
定界应用与资源的问题。 优势 应用自动发现:自动部署采集器,针对应用的运行环境,主动发现应用并进行监控。 跨云服务的分布式应用监控:对于同时使用了多种云服务的分布式应用,提供统一的运维平台,便于您对业务进行立体排查。 告警灵活通知:提供多种异常检测策略并支持丰富的异常告警触发方式及API。