检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形式来展示资源的指标数据或日志数据,帮助用户全面、深入地掌握监控数据。 约束与限制 新版仪表盘功能的图表配置与旧版仪表盘功能的图表配置不相同。 使用旧版仪表盘编辑新版仪表盘中创建的图表时,旧版仪表盘的图表配置无法兼容新版仪表盘的图表配置。 使用新版仪表
容器监控和组件监控的区别在于所监控的对象不同。 组件监控是全量监控,监控对象为通过CCE部署的工作负载、通过ServiceStage创建的应用,或直接在ECS或BMS上部署的组件。 容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建的应用。 组件监控详细操作请参见:组件监控。
应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。 应用: 一个完整的业务模块,由多个组件组成。
用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。AOM并非传统监控,它通过应用的角度看业务,满足企业对业务的高效和快速迭代的需求,可帮助企业实现IT对业务的有效支撑,保护、优化IT资产投资,使企业更好的达到其战略目标并实现IT资产调优。
查询时序数据 场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格式
欠费说明 用户在使用云服务时,账户的可用额度小于待结算的账单,即被判定为账户欠费。欠费后,可能会影响云服务资源的正常运行,请及时充值。 欠费原因 按需计费模式下,您的账户的余额不足会导致欠费。 欠费影响 当您的账号因AOM按需资源自动扣费导致欠费后,账号将变成欠费状态。欠费后,按
称,可查看该组件所有实例的概况;单击实例名称,可查看进程的监控视图与告警信息。 在“主机列表”页签下,可查看该应用的主机运行状态、资源使用情况等信息。 在“监控视图”页签下,选择对应的Prometheus实例,可查看该应用的资源使用情况。单击页面右上角的,可全屏展示资源信息。 在
PAAS_APP_NAME:应用名称,即要部署的工作负载名称。 PAAS_NAMESPACE:命名空间名称,即要部署的工作负载所在CCE集群的的命名空间。可进入CCE集的详情页的“命名空间”页面进行查询。 PAAS_PROJECT_ID:租户的项目ID。获取方法详情请参见:获取项目ID。 以上env相关参数的value请根据实际情况替换。
单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 图3 新增PodMonitor 配置完成后,新增的采集规则将显示在下方的列表中。 图4 配置采集规则 其他相关操作 CCE集群的指标管理配置完成后,您还可以执行表1中的操作。 表1 相关操作
华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。
本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维人员使用开源的监控软件,虽然能采集很多指标,但却分散在各处,无法统一展示。
单击监控条件后的,可将对应行的指标数据在当前图表中隐藏。 单击监控条件后的,可将对应行的指标数据和监控条件转换为Prometheus命令。 单击监控条件后的,可快速复制对应行的指标数据及监控条件等信息,并根据需要修改。 单击监控条件后的,可删除对应行指标数据的监控。 通过“按普
通过AOM监控集群 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
输入类名称并选择方法名,单击“确认”,页面将显示该方法某次执行的具体信息。 图1 方法分析详情 查看执法记录:页面左侧展示该方法的执行记录,包括:耗时明细、调用来源以及方法源码。 耗时明细展示调用方法、耗时时间并支持“下钻”操作。 单击操作列的“下钻”,可以查看此调用方法的详细信息。 查看默认观测项目:页面
心数,假设您的集群中包含3个节点,则采样点分布于3条不同的时间线上。若每个节点的采样周期为15s,则一分钟的时间范围内,上报的采样点数据的总条数为:3*(60/15)=12(条),如下图所示: 会产生自定义指标上报的场景:接入Prometheus后,为什么会产生额外费用?。 指标存储时长
”字段的值。 如果2为空,则取环境变量“PAAS_MONITORING_GROUP”的值。 如果3为空,则取进程的启动命令中“DAOM.APPN”字段的值。 组件名称取值优先级: 取进程的启动命令中“DAOM.PROCN”字段的值,如果为空则取“Dapm_tier”字段的值。 如
查询时间序列 场景描述 本章以查询一个节点的CPU使用率时间序列为例。 涉及的基本信息 查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使用
标签名称 标签的名称。 支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线、点和中文字符组成。 描述 标签的描述信息,最多可输入255个字符。 关联节点 标签要关联的节点。 区域:资源支持的区域,请从下拉列表中选择或输入关键字搜索后选择。 节点:待关联的节点,直接从下
其他中间件指标接入AOM 如果当前AOM提供的中间件Exporter插件不满足您的需求,可以先安装自定义的Exporter,然后使用AOM提供的Custom Exporter插件创建采集任务,即可以监控该中间件的相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS
使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。