检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
(可选)设置指标数据的展示形式。 在页面右侧单击图表类型后的向下箭头,从下拉列表中选择合适的图表类型,并设置图表的配置参数,例如X轴名称、Y轴名称及显示数值等,配置参数的说明具体请参见指标数据类图表。1个折线图最多支持展示200条指标数据。 图3 选择图表类型 监控指标相关操作 您还可以执行表2中的操作。
通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过
API 告警 监控 prometheus监控 日志 Prometheus实例 配置管理 UniAgent管理 仪表盘 应用资源管理(aom2.0接口) 自动化运维(aom2.0接口)
查看操作日志 AOM会记录用户对UniAgent和其他插件执行安装、升级、卸载历史任务的操作日志。您可以查看相关任务的操作日志。 查看UniAgent操作日志 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。当前仅华南-广州区域的菜单路径为:在左侧导航栏选择“全局设置”,进入全局设置页面。
基础设施功能支持通过仪表盘图表展示APM实例下的性能指标数据。例如,折线图、数字图等,帮助用户全面、深入地掌握应用性能监控数据。 约束与限制 需要提前在组件设置中配置组件与基础设施关联分析设置后,组件详情页面才会展示基础设施页签。 查看组件基础设施 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控
可观测大屏监控 运维可观测大屏是基于华为云Astro低代码平台开发的面向不同场景、角色的运维监控大屏,基于现网质量、服务韧性、评估优化等N大主题域,通过运维数据建模、可视化等数据分析能力,提供企业级运维沙盘。满足您全场景、自动化、可量化、可观测的一体化监控解决方案,为业务健康和稳定保驾护航。
ount 配置个数 ServiceComb配置个数。 ≥0 个 Nacos config nacos_configCount Nacos config配置个数 Nacos集群内各节点的配置个数。 ≥0 个 nacos_getConfig Nacos config读配置请求数 Nacos集群内各节点的读配置请求次数。
M预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 告警时延设置:支持配置0.5s、1s、3s、5s、10s。 错误时延设置:支持配置1s、3s、5s、10s、15s。 单击组件之间的连线,会在右侧显示详细的请求数、平均RT、错误率等数据。
据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
仪表盘支持通过变量拼接填充图表标题。新增变量后,在仪表盘配置图表标题处使用“${变量名称}”进行拼接填充,即可基于该变量的过滤器下拉列表值,动态展示图表标题信息。 例如:仪表盘配置的原图表标题为“Dashboard”,新增的变量名称为“ClusterName”,即可以在仪表盘图表标题处配置“${ClusterName}
UniAgent管理 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 下发批量安装UniAgent任务 POST /v1/{project_id}/uniagent-console/mainview/batch-import
支持多实例聚合查询,例如:按标签、按资源组等聚合。 PromQL语法 不支持 支持,告警规则、仪表盘、指标浏览等监控功能均支持。 仪表盘 支持标准云产品的单实例大盘。 提供丰富的预置模板。 仪表盘支持的图表类型 2 8+ 仪表盘支持的监控视图数 50 100+ 创建告警规则数 仅支持1000。
如果要通过终端节点的方式打通AOM/LTS的网络,需要为AOM和LTS各自购买1个终端节点。 创建AOM/LTS终端节点的方法: 登录华为云VPC终端节点VPCEP控制台,进入终端节点页面。 单击“购买终端节点”。 在购买终端节点页面,选择终端节点所在的区域,“服务类别”选择“云
S桶中,以便进行长期存储。日志数据的相关费用统一由LTS提供并上报话单,AOM不会双算。 指标数据:通过数据订阅功能,将指标数据转发到用户配置的DMS或Webhook的Topic中存储。
AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
开启分批发布后需填写每批发布的时间间隔。 审批配置 人工审核 选择是否开启人工审核开关,默认不打开。 审批配置不允许更改,如需更改,需在工具市场中对该原子服务卡片进行审批配置。 审批人设置 开启人工审核后,需要选择审批人。 通过选择“主题”的方式配置审批人,您需要在消息通知服务中,创建一个新主题,并为这个主题添加订阅。
Operations Management,简称AOM)。应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,提供一站式可观测性分析和自动化运维方案,支持快速从云端、本地采集指标、日志和性能数据,帮助用户及时发现故障
操作类型 操作类型,包括安装和卸载两种类型。 目标存储路径 可通过${var_name}方式引用全局变量的字符串参数。 文件来源 回填所选的文件包版本中的文件来源,参见表1。 平台 文件包运行的平台,目前仅支持Linux。 脚本类型 操作类型选择“安装”,脚本类型为“安装脚本”。前置脚本
“集成中心”为CCE集群安装云原生监控插件,上报指标到指定的CCE类型Prometheus实例中。 当前仅CCE类型Prometheus实例支持。 接入中心 AOM集成Prometheus中间件插件,支持在Prometheus实例的“接入中心”为虚机安装中间件Exporter,将上报指标到指定的ECS
云服务授权 为当前用户一键授予云资源实例 (RMS)、云日志服务 (LTS)、云容器引擎 (CCE)、云容器实例 (CCI)、云监控 (Cloud Eye)、分布式消息 (DMS)、弹性云服务器 (ECS)云服务数据的访问权限。该权限设置针对整个AOM服务生效。 前提条件 AOM