检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
异常重启的时候,部分主机、组件、容器等资源会出现一个采集周期的指标数据断点,该数据断点对于用户来讲监控页面上能看到一个断点,没有其他影响。如果对断点有要求,可以在“监控”->“指标浏览”页面中查看指标曲线时,将插值方式设置为0或者average,系统会自动补点,如图1所示。 图1
只能由大小写字母、数字、下划线组成,且不能以下划线开头和结尾,最多不能超过100个字符。 rule 企业项目 所属的企业项目。 如果在全局页面设置为“ALL”,此处请从下拉列表中选择企业项目。 如果在全局页面已选择企业项目,则此处灰化不可选。 default 描述 分组规则的描述。最多不能超过1024个字符。本示例可不填写。
Exporter是通过Nginx的stub_status模块对其进行监控,需要确保Nginx服务启用了 stub_status模块。具体步骤如下: 登录到业务Nginx服务所在节点,以root权限用户执行以下命令检查Nginx是否已经启用stub_status模块(一般在/usr/local/nginx/sbin/nginx目录下执行):
Forbidden 请求被拒绝访问。返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 503
从作业模板中挑选1个或多个步骤组合组成执行方案。是作业模板的实例化对象。 云服务场景 云服务提供的原子化的变更场景。例如重启ECS。 标准化运维 将脚本、文件管理、执行方案、云服务场景组合合成一套操作流程,用于标准化特定场景的运维场景变更。 服务场景 将作业、标准化运维发布成服务,用户无需感知底层操作逻辑,仅输入简单的信息即可自助完成特定运维场景。
务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集器)并通过ICAgent上报相关的运维数据。 API接入数据 通过AOM提供的OpenAP
应用监控 应用监控概述 查看应用性能指标 监控组件性能指标 通过全局拓扑图查看应用间调用关系 通过调用链查看微服务间调用关系 管理APM探针启停状态 APM配置
deploymentName k8s Deployment名称。 kind 应用类型。 nameSpace 集群的命名空间。 podID 实例ID。 podName 实例名称。 serviceID 存量ID。 gpuID GPU ID。 npuName NPU名称。 npuID NPU ID。
监控总览 监控概览 仪表盘
告警管理 告警管理使用说明 告警规则(旧版) 告警规则(新版) 创建通知规则 查看告警 查看事件 告警行动规则 告警降噪
告警监控 AOM告警监控概述 配置AOM告警通知 配置AOM告警规则 查看AOM告警或事件 配置AOM告警降噪
参考信息 Agent包下载配置
智能洞察(BETA) 开通智能洞察 通过AOM查看事件巡检数据 通过AOM查看事件根因分析结果 通过AOM查看故障传播链
empty", "trace_id" : "" } 状态码: 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 { "error_code" : "APM.00000500", "error_msg" : "Internal
资源监控 资源监控使用说明 应用监控 组件监控 主机监控 容器监控 指标浏览 云服务监控
权限管理 创建用户并授权使用AOM AOM自定义策略 云服务授权
运维管理 运维管理概述 开通自动化运维 自动化运维权限管理 服务场景 管理定时运维 管理任务 配置参数库 管理作业 管理脚本 管理文件 运维配置 管理工具市场 高危命令说明
应用代表一个逻辑单元,可以理解为项目、产品、业务。应用创建后,每个region都可以看到相同的应用拓扑信息。 例如一个商城应用包含用户管理服务、登录验证服务、商品列表、订单管理服务等。 子应用 应用管理的可选节点,同一个应用下,最多可创建三层子应用。子应用可以理解为服务,对组件/微服务的归组分类。
notificationTemplate delTemplate 自动化运维 开通自动化运维服务 function functionRegister 更新用户信息 function functionRegister 更新任务定时触发器 workflow operateCronTriggerFlow
基础设施监控 通过AOM监控工作负载 通过AOM监控集群 通过AOM监控主机 通过AOM监控进程 通过AOM监控云服务