检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体验、如何将散落的日志进行关联分析、如何快速追踪问题。 AOM帮您解决 图2 一站式运维平台
获取Node.js应用的指标、链路追踪和日志信息。具体操作请参见:Node.js组件调用链接入(APM)。 PHP组件 获取PHP应用的指标、链路追踪和日志信息。具体操作请参见:PHP组件调用链接入(APM)。 .NET组件 获取.NET应用的指标、链路追踪和日志信息。具体操作请参见:
如何创建委托apm_admin_trust? 创建委托 登录IAM控制台。 在左侧导航栏,单击“委托”,进入委托页面。 单击右上角“创建委托”,进入创建委托页面。 参考表1设置创建委托的参数。 表1 创建委托 名称 说明 样例 委托名称 标识该委托代理的名称。 须知: 委托名称必须为apm_admin_trust。
如何设置全屏模式在线时长? 为保障客户信息的安全性,AOM提供了在线超时退出机制,即:登录控制台后,打开任意一个界面,如果在1小时内无任何操作,则会自动退出到登录界面。 当在使用AOM的全屏模式(包括运维概览全屏模式和仪表盘全屏模式)进行监控时,全屏模式会随着用户账号的退出而退出
获取钉钉小程序的指标、链路追踪和日志信息。具体操作请参见: 接入日志(LTS) 接入调用链(APM) 百度小程序 获取百度小程序的指标、链路追踪和日志信息。具体操作请参见: 百度小程序日志接入(LTS) 百度小程序调用链接入(APM) 快应用小程序 获取快应用小程序的指标、链路追踪和日志信
{跳板机ip}:8149:{elbip}:8149 -L {跳板机ip}:8102:{elbip}:8102 -L {跳板机ip}:8923:{elbip}:8923 -L {跳板机ip}:30200:{elbip}:30200 -L {跳板机ip}:30201:{elbip}:30201
{跳板机ip}:8149:{elbip}:8149 -L {跳板机ip}:8102:{elbip}:8102 -L {跳板机ip}:8923:{elbip}:8923 -L {跳板机ip}:30200:{elbip}:30200 -L {跳板机ip}:30201:{elbip}:30201
卸载后重新安装。 离线 AK/SK配置不正确或30200、30201端口未连通,处理操作详见如何处理界面“ICAgent状态”为“离线”的问题。 异常 主机ICAgent功能异常,请联系技术人员处理。 可能原因二:AOM不支持监控当前资源类型 修复建议:请检查您的资源是否为AOM
图1 查看调用链 在“调用链”页面中查看调用链信息。 在查询条件下输入查询条件查询具体的调用链列表,也可在界面下方新增自定义查询条件。 表1 调用链查询条件说明 查询条件 说明 必填/选填 应用 选择调用链所在应用。 必填 区域 选择调用链所在区域。 必填 组件 选择调用链所在组件。
String 错误码。 error_msg String 错误信息。 error_type String 错误类型。 trace_id String 链路id。 请求示例 删除project_id下prom_id为08****2a-8b-45-b1-d1******79的Prometheus实例。
维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
事件根因分析:提供基于应用性能管理APM平台的调用链追踪根因定位技术。可以从应用服务和流量Top N接口的指标、调用链维度,全局分析问题,快速诊断并定位故障根因。 故障传播链分析:提供基于应用性能管理APM平台的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,
和检测规则等信息。 图2 设置告警规则详情 表3 告警规则详情填写说明 参数名称 参数说明 示例 多指标 按设置的多个指标数据和对应告警条件逐条计算,只要满足一个条件则触发告警。 多指标 指标 需要监控的指标。单击“指标”文本框,通过下列框右侧的资源树,可以按资源类型快速选择需监控的指标。
String 链路id。 状态码: 401 表10 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误信息。 error_type String 错误类型。 trace_id String 链路id。 状态码:
通过helm部署pod后,AOM无法查找到工作负载 问题描述 通过helm部署pod后,AOM无法查找到对应的工作负载。 原因分析 在CCE控制台的工作负载页面找到通过helm部署的pod记录,然后对比helm部署pod的yaml文件和直接在CCE控制台部署pod的yaml文件,
区域开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 AOM提供告警降噪功能,您可以在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 告警降噪功能分为分组、去重、抑制、静默四部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。
AOM告警降噪概述 AOM提供告警降噪功能,您可以在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 功能说明 告警降噪功能分为分组、去重、抑制、静默、屏蔽部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。
编辑作业后,作业的执行方案未更新 编辑作业后不会自动同步更新该作业的执行方案。 解决方法 编辑作业后,该作业的执行方案不会自动更新,需要用户重新创建该作业的执行方案。创建执行方案的详细操作请参考作业管理。 父主题: 运维管理(即将下线)
每个实践提供详细的方案描述和操作指导,帮助用户轻松使用AOM。 表1 AOM 最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。