检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
持按需计费。 说明: 当处于冻结、受限状态时,无法进行增加、删除、修改Prometheus实例的操作。 欠费后,可能会影响云服务资源的正常运行,请及时充值。有关欠费的详细说明请参见欠费说明。 父主题: Prometheus监控
资源集下,LTS中所有ECS主机的采集配置都失效。 ICAgent状态说明详见下表。 表1 ICAgent状态 状态 说明 运行 该主机ICAgent运行正常。 未安装 该主机未安装ICAgent。安装ICAgent,详细操作请参见安装ICAgent。 安装中 正在为该主机安装I
此卡片主要展示基础设施的指标数据。可通过选择集群,呈现某一个集群或者所有集群中的信息。如图选择所有集群,即该基础设施监控卡片呈现所有集群的如下信息: 主机运行状态,CPU、物理内存的使用量。 近30分钟网络流量数据的趋势图,趋势图每1分钟一个点,趋势图每一个点的值表示1分钟内所有集群的接收Bps
阈值规则和告警通知:依赖消息通知服务(简称SMN),将阈值规则状态变更信息和告警信息以邮件或短信的方式发送给相关人员,以便及时获取资源运行状态等信息并采取相应措施,避免因资源问题造成业务损失。SMN-价格说明 日志转储:依赖对象存储服务(简称OBS),将日志文件转储到OBS桶中,以便进行长期存储。OBS-价格说明
指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。 告警规则 告警规则 告警规则(包含指标告警规则和事件告警规则)最多可创建3000个。
MS)。只要主机的操作系统满足AOM支持的操作系统,且主机已安装ICAgent,即可将主机接入到AOM中进行监控。 日志 AOM提供了海量运行日志的检索和分析功能,支持日志采集、下载、转储、搜索,并提供报表分析、SQL查询、实时监控、关键词告警等能力。 AOM的基础版和按需版所对
提供一站式可观测性分析和自动化运维方案,支持快速从云端、本地采集指标、日志和性能数据,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。 您可以使用本文档提供的API对应用运维管理服务进行相关操作,例如创建、删除、查询等。支持的全部操作请参见API概览。
使用Remote Read地址和Remote Write地址,将自建Prometheus的监控数据存储到AOM的Prometheus实例中,实现远程存储。 预聚合 通过配置预聚合规则将计算过程提前到写入端,可减少查询端资源占用,尤其在大规模集群和复杂业务场景下可以有效的降低Prom
接入弹性云服务器ECS 登录AOM 2.0控制台。 左侧导航栏选择“接入 > 接入中心”,单击页面右上角“体验新版”,进入新版接入中心页面。 筛选出“运行环境”下的“弹性云服务器ECS”卡片,并单击卡片上的“接入指标(AOM)”。 配置接入弹性云服务器ECS的相关参数。 选择Prometheus实例。
_code,将原生Prometheus的指标通过remote write上报到AOM服务端,参见将Prometheus的数据上报到AOM,实现时序数据的长期存储;也可以通过access_code作为认证凭据来查询AOM中的数据,参见通过grafana查看AOM中的指标数据,AOM
用方统计的,并且可以查看这个调用关系的趋势图。 详细介绍请参见拓扑。 Profiler性能分析 Profiler性能分析,自动获取应用程序运行过程中的CPU、内存、时延的使用情况,通过火焰图的实时展示每一个方法的调用关系和执行率,帮助优化代码性能。 详细介绍请参见Profiler性能分析。
关指标,详情请参考配置应用发现规则。 监控应用 在左侧导航栏中选择“监控 > 应用监控”,查看应用列表。 可以在应用列表上方设置过滤条件,实现应用列表过滤显示。 单击应用名称,在“应用详情”页面,以应用维度对组件进行批量管理与监控。 您还可查看当前应用包含的组件列表、主机列表和告警分析。
脚本上线完成后,您可以在脚本列表页面执行脚本任务。执行脚本依赖uniAgent的能力,用户需要确保执行脚本的ECS实例已经安装uniAgent且为运行中状态。 在左侧导航栏中选择“脚本管理”,在脚本管理页面,单击脚本列表待执行脚本所在行操作列的“执行”。 输入脚本参数、超时时长、执行账号
0以上的云原生监控插件(kube-prometheus-stack)上报的指标可以被废弃,且只有kube-prometheus-stack处于“运行中”状态时,指标才能废弃成功。 查看kube-prometheus-stack插件状态的方法:登录CCE控制台,单击集群名称进入集群,在左
登录APM控制台。 在左侧导航栏选择“Web监控 > 自定义上报”。 自定义上报 会话追踪 APM支持会话追踪功能,此功能根据用户名或者用户ID,实现全链路追踪。复现用户访问时的行为轨迹,以便于定位问题。会话追踪包括:访问追踪、性能追踪、API追踪、JS错误追踪、行为追踪以及自定义追踪。
S和华南-广州区域的OBS的权限,基于角色与策略授权的场景中,管理员需要创建两个自定义策略,并且为IAM用户同时授予这两个自定义策略才可以实现权限控制。在基于身份策略授权的场景中,管理员仅需要创建一个自定义策略,在策略中通过条件键“g:RequestedRegion”的配置即可达
环境以及现网环境等。 环境:一个组件或者程序,由于部署不同的配置参数,形成多个环境。每个环境都有region属性,可以通过region信息实现环境的过滤,也可以在创建环境时打上一个或多个标签,通过标签进行环境过滤。例如按照环境类型区分包括:正式、测试。按照区域区分包括:华东、华南
0~100 百分比(%) 主机 aom_node_process_number processNum 进程数量 该指标用于统计测量对象上正在运行的进程个数。 ≥0 无 Atlas 500 智能小站 aom_node_npu_temperature_centigrade node_temperature
并且此消息模板不可删除与编辑。 除默认模板的消息字段外,消息模板还支持用户自定义字段,需用户在上报事件告警信息时在指定参数上传该字段,具体实现参考接口文档:API事件告警,对应参数见下方消息模板告警上报结构体。 自定义字段支持以JSONPath的方式取值,示例:$event.metadata