检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
http://{集群任意节点私有IP}:30378/metrics 访问地址:http://{集群任意节点的公网IP}:30378/metrics 如发现未能得到数据,请检查一下部署Redis Exporter时YAML中的REDIS_ADDR和REDIS_PASSWORD是否正确,示例如下: 图2 访问地址 在实例列表中单击操作列下的“更多
http://{集群任意节点私有IP}:30378/metrics 访问地址:http://{集群任意节点的公网IP}:30378/metrics 如发现未能得到数据,请检查一下部署Redis Exporter时YAML中的REDIS_ADDR和REDIS_PASSWORD是否正确,示例如下: 图2 访问地址 在实例列表中单击操作列下的“更多
”,告警级别为“紧急”,表示连续三个统计周期,指标的平均值大于已设置的阈值1时,生成紧急告警。 图9 设置告警规则 单击“高级设置”,设置检查频率、告警恢复等信息。 设置告警通知策略。告警通知策略有两种方式,如图10所示,此处选择直接告警方式。 直接告警:满足告警条件,直接发送告
4030000 Forbidden 请更换有权限的账号。 SVCSTG.INV.4000115 Invalid request parameter. 请检查参数。 SVCSTG.INV.5000002 The Elasticsearch execution is abnormal. 请联系技术支持工程师解决。
一指标展示到同一个图形界面上进行对比。另外,对于例行运维需要查看的指标,可添加到仪表盘中,以便再次打开AOM时无需重新选择指标就可进行例行检查任务。 创建仪表盘前,请您先了解仪表盘中支持添加的图表类型,以便选择合适的图表,更精准地对资源进行监控。仪表盘中支持添加的图表如下: 指标数据类图表(包括曲线图和数字图)
的同一指标展示到同一个图形界面上对比。另外,对于例行运维需要查看的指标,可添加到仪表盘中,以便再次打开AOM时无需重新选择指标就可进行例行检查任务。 发布区域:华北-乌兰察布-汽车一、华北-乌兰察布一、华北-乌兰察布二零一、华北-乌兰察布二零二、中东-利雅得、华北-北京一、华北-
毫秒(ms) flink_jobmanager_job_lastCheckpointSize 最新checkpoint的大小,如果启用了增量检查点或更改日志,则此度量可能与lastCheckpointFullSize不同。 字节(Byte) flink_jobmanager_job
统计图表说明(新版) 仪表盘功能支持通过统计图表的方式将指标数据、日志数据的查询和分析结果进行可视化展示。 指标数据类图表 指标类图表支持选择的图表类型有:折线图、数字图、TopN、表格、柱状图、数字折线图。 折线图:属于趋势类分析图表,一般用于表示一组数据在一个有序数据类别(多
coredns_forward_healthcheck_broken_total 健康检查broken次数 coredns_forward_healthcheck_failures_total 健康检查失败次数 coredns_forward_max_concurrent_rejects_total
统计图表说明 仪表盘功能支持通过统计图表的方式将指标数据、日志数据的查询和分析结果进行可视化展示,支持的图表类型有折线图、数字图、状态图等。 指标数据类图表 指标数据类图表支持的图表类型:折线图、数字图、TopN、表格、柱状图、数字折线图。 折线图:属于趋势类分析图表,一般用于表
公共响应消息头 响应的消息报头在大多数情况下含有下面报头: 表1 响应消息头 名称 描述 示例 Date HTTP协议标准报头。表示消息发送的时间,时间的描述格式由rfc822定义。 Mon,12 Nov 2007 15:55:01 GMT Server HTTP协议标准报头。包含了服务器用来处理请求的软件信息。
Prometheus语句模板。 trigger_times String 连续周期个数。 trigger_interval String 检查频率周期。 当trigger_type 为“HOURLY”时,填“” 当trigger_type为“DAILY”时,格式为:“小时” 例如
的同一指标展示到同一个图形界面上对比。另外,对于例行运维需要查看的指标,可添加到仪表盘中,以便再次打开AOM时无需重新选择指标就可进行例行检查任务。 注意事项 系统预置的仪表盘模板都保存在“系统内置”分组下,包含容器、云服务、原生中间件、应用。预置仪表盘不允许删除或调整分组,仪表盘模板不支持创建。
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
产品优势 表1 产品优势 开箱即用 一键安装部署即可监控Kubernetes以及各类云产品。 一键接入各种应用组件及告警工具。 低成本 多种指标免费用,覆盖Kubernetes标准组件。 提供全托管式服务,无需另购资源,可降低监控成本,且维护成本几乎为零。 与CCE集成并提供监控
什么是应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化
约束与限制 应用资源管理使用限制 表1 应用资源管理使用限制 对象 使用限制 应用 租户创建的应用个数<=1000。 子应用 应用下创建的子应用数量<=50。 组件 子应用下的创建的组件数量<=50。 环境 组件下可创建的环境数量<=20。 资源 单个环境管理的同类实例资源数量<=2000。
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES的云服务监控功能对比
脚本管理 “脚本管理”页面展示现有的所有脚本信息。您可以在这里创建脚本,也可以修改、复制已创建的脚本。创建完成后,可以为脚本新建执行任务,也可创建任务后在任务管理中执行并查看。每个脚本支持最多创建20个版本,单用户支持创建的所有脚本的版本合计最多1000个。 创建脚本 登录AOM
基本概念 本文汇总使用Prometheus监控过程中涉及的基本概念,方便您查询和了解相关概念。 表1 基本概念 概念 说明 Exporter 一个采集监控数据并通过Prometheus监控功能规范对外提供数据的组件。目前有上百个官方或者第三方 Exporter可供使用,具体请参见Exporter详情。