检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安全 责任共担 身份认证与访问控制 数据保护技术 审计与日志 服务韧性 监控安全风险 认证证书
不支持 支持 日志分析 通过日志接入和日志搜索功能帮您快速在海量日志中查询到所需的日志,还可通过分析日志的来源信息和上下文原始数据快速定位问题。 支持 支持 进程监控 通过配置应用发现规则发现和收集主机上部署的应用和关联的指标,并支持从应用下钻到组件,从组件下钻到实例,从实例下钻
该指标用于统计测量对象的NPU存储容量。 说明: 仅支持CCE类型主机的NPU指标采集。 >0 兆字节(MB) aom_node_npu_memory_usage NPU存储使用率 该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。 说明: 仅支持CCE类型主机的NPU指标采集。 0~100
概述 组件设置包括自定义设置、Agent设置以及监控项。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列,某一个组件名称,进入该组件指标项详情页,默认展示“接口调用”详细信息。
系统性能及业务等信息。 注意事项 快速分析的对象为结构化日志中提取的关键字段,创建快速分析前请先对原始日志进行结构化配置。 创建快速分析 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志流”。 在“原始日志”页面单击“创建快速分析”按钮,如图1所示。 图1 创建快速分析
容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
应用发现 应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用和关联的指标。从是否需要您来操作的角度区分应用发现方式,则有两种,自动发现和手动配置。本章节介绍手动配置操作。 自动发现 您的主机安装ICAgent后,ICAgent会根据内置发现规则发现主机上的应用,并呈现在“应用监控”界面。
公共请求消息头 表1 公共请求消息头 名称 描述 是否必选 示例 X-Auth-Token 用户Token。 使用Token认证时必选 - Content-Type 内容类型。 该字段内容填为“application/json;charset=utf8”。 必选 applicat
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
企业只有了解组织中哪些方面产生了成本,才能正确地控制和优化成本。成本中心支持使用“成本分析”的汇总和过滤机制可视化企业的原始成本和摊销成本,从而通过各种角度、范围分析成本和用量的趋势及驱动因素。 企业还可以通过成本中心的“成本监控”,及时发现计划外费用,做到成本的可监控、可分析和可追溯。 详细介绍请参见通
全面掌握应用、资源及业务的实时运行状况。 常用操作 接入中心 告警管理 仪表盘 指标浏览 日志分析 Prometheus监控 基础设施监控 应用监控 常见问题 了解更多常见问题、案例和解决方案 常见使用问题 如何区分告警和事件? 怎样查看AOM中的日志是通过哪个应用产生的? 如
AOM使用流程 开通AOM(必选) 创建子账号并设置权限(可选) 给企业中不同职能部门的员工创建IAM用户,还可以根据企业用户的职能设置不同的访问权限。 购买云主机(必选) 每一台主机对应云上的一台虚拟机(例如:弹性云服务器ECS)或物理机(例如:裸金属服务器BMS)。主机可以在EC
deploymentName 工作负载名称。 kind 应用类型。 nameSpace 集群的命名空间。 podID 实例ID。 podIP 实例IP。 podName 实例名称。 serviceID 存量ID。 nodename 主机名称。 nodeIP 主机IP。 virtualServiceName
在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 SDK列表 表1提供了AOM服务支持的SDK列表,您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。 表1 SDK列表 编程语言 Github地址 参考文档
资源运行异常怎么办? 资源状态包括正常、亚健康、异常和通道静默。亚健康、异常或通道静默都可能导致资源运行异常,您可参考如下指导进行分析和修复。 亚健康 当有级别为次要或提示的告警时资源状态为亚健康。 修复建议:请在告警界面参考告警详细信息处理告警。 异常 当有级别为紧急或重要的告警时资源状态为异常。
组件进行监控,结合应用运维管理平台和开源Grafana可以提供一站式全方位的监控体系,帮助业务快速发现和定位问题,减轻故障给业务带来的影响。 已接入的组件会显示在采集任务页面,可以配仪表盘、告警规则。 采集任务主要有两类,分别为中间件采集任务和自定义采集任务。 中间件采集任务:使用中间件插件创建的采集任务。
1200以上(百万条):0.25元/百万条/天 指标存储时长 AOM 2.0默认支持的指标存储时长为15天。15天内免费使用,超过15天则按量累计计费。 0.01元/百万条/天 数据转储量 AOM支持的指标数据转储量,按量累计计费。 0.2元/GB 计费示例 以自定义指标上报量使用场景为例。
方法分析 方法分析支持检查正在运行的方法的耗时明细、调用来源以及方法源码。用于快速定位问题的根本原因,以及问题线下无法复现或日志缺失等场景。 方法分析 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。
性分析和自动化运维方案,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业海量运维的自动化能力和效率。 托管&运行态:AOM可无缝对接多个上层运维服务,支持快速从应用管理与运维平台(ServiceStage)、函数工作流(FunctionGraph)和微服务引擎(Cloud
参数名称 参数类型 描述 id String 策略组属性ID max_instances Integer 最大实例个数 min_instances Integer 最小实例个数 cooldown_time Integer 冷却时间,单位:秒 响应示例 { "errorCode":