检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何通过创建委托获取AK/SK? 通过创建委托,ICAgent自动获取用户的访问密钥(AK/SK)帮助用户进行应用性能管理。 创建委托 登录华为云控制台。 单击右上角的用户名称,如图1,选择“统一身份认证”。 图1 用户名称 在“统一身份认证”页面中,单击“委托”,进入委托页面。 单
IAM为开发人员创建用户,通过授予仅能使用应用发现规则,但是不允许删除应用发现规则的权限策略,控制其对应用发现规则资源的使用范围。 如果华为云账号已经能满足您的使用需求,不需要创建独立的IAM用户进行权限管理,您可以跳过本章节,不影响您使用AOM的其它功能。 IAM是提供权限管理
本Region外:给区域外主机安装UniAgent,即给用户登录AOM服务控制台所在region区外的其他区域主机安装UniAgent。例如华为云其他region、第三方都属于区域外主机。 当前新版安装UniAgent功能在邀测中,支持华北-北京四、华东-上海一局点,仅针对用户内测使
使用AOM 2.0前,需要先注册一个华为账号并进行实名认证。如果您已有一个华为账号,可直接跳过如下操作。 进入华为云官网,单击页面右上角的“注册”。 参考注册华为账号并开通华为云中操作,完成注册。 注册后参考实名认证完成个人或企业账号实名认证。 开通AOM 2.0。 使用AOM 2.0前,需要先开通AOM
本地浏览器时间和ECS时间一致。 安装ICAgent 登录AOM控制台,选择“配置管理 > Agent管理”。 单击“安装ICAgent”,主机类型选择“华为云主机”,安装方式选择“获取AK/SK凭证”。 单击“复制命令”复制安装命令。 通过ECS控制台提供的远程登录方式登录ECS。 登录ECS控
在“账号接入”界面可以管理成员账号、接入云服务、选择数据存储,并添加云服务支持的相关指标。 管理成员账号:AOM为企业用户提供多账号关系的管理能力,支持用户将多个华为云账号整合到创建的组织中,并可以集中管理组织下的所有账号。组织下有三种成员类型,分别为组织管理员、委托管理员和普通用户。普通用户无权限在AOM监控多账号指标。
通过在VPC内的某台虚机上安装uniagent(Exporter)插件提供针对此VPC内ECS应用和组件(如数据库,中间件等)的一体化监控。 适合需要对运行在华为云的虚拟私有云VPC内(通常为弹性云服务器ECS集群)的应用组件进行监控场景,可以通过接入中心添加Prometheus中间件监控。 Prometheus实例
prometheus 实例 单击列表中“所属 prometheus 实例”列下的实例名称,即可跳转至实例详情页面。 日志接入规则 AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中“日志接入规则”功能由云日志服务LTS提供。用户可在AOM 2.
AOM的基础版和按需版所对应的指标存储时长及计费方式不同,详见收费详情。 主机 AOM的每一台主机对应一台虚拟机或物理机。主机可以是您自己的虚拟机或物理机,也可以是您通过华为云购买的虚拟机(例如:弹性云服务器,简称ECS)或物理机(例如:裸金属服务器,简称BMS)。只要主机的操作系统满足AOM支持的操作系统(AO
在企业微服务之间调用复杂的场景下,APM Agent会抽样一些请求,拦截对应请求及后续一系列的调用信息。比如在A调用B然后调用C的场景,请求进入A后,APM系统会采用智能采样算法,决定是否对请求进行调用链跟踪。 详细介绍请参见调用链。 组件设置 组件设置包括关联日志服务、Profiler性能剖析配置以及组件
规则原始名称:${event_name} 告警级别:${event_severity} 发生时间:${starts_at} 发生区域:${region_name} 华为云账号:${domain_name} 告警源:$event.metadata.resource_provider 资源类型:$event.metadata
标值及趋势,还可将关注的指标添加到仪表盘,对其创建阈值规则和导出监控报告等操作,以便实时查看业务及分析数据。 云服务监控 云服务监控展示华为云各服务实例的历史性能数据曲线。最长可查看近6个月内的数据,有助于用户了解实例运行状况。 日志 提供日志搜索、日志文件、日志转储、日志路径等功能。
String 所属project ID。 version String UniAgent版本。 is_hw_cloud_host String 是否华为云机器。 vpc_id String VPC ID。 cmdb_id String CMDB ID。 ecs_id String ECS ID,唯一值。
aom_node_process_number processNum 进程数量 该指标用于统计测量对象上正在运行的进程个数。 ≥0 无 Atlas 500 智能小站 aom_node_npu_temperature_centigrade node_temperature 节点温度 Atlas 50
中划线和点组成。 应用名称 应用的名称。 支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线、点和中文字符组成。 企业项目 华为云企业项目,请从下列列表中选择。 如果现有的项目无法满足需求,可单击“创建项目”添加。 描述 应用的描述信息,最多可输入255个字符。 设置完成后,单击“确认”。
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
使用流程 应用运维管理(Application Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。
什么是应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化
基本概念 本文汇总使用Prometheus监控过程中涉及的基本概念,方便您查询和了解相关概念。 表1 基本概念 概念 说明 Exporter 一个采集监控数据并通过Prometheus监控功能规范对外提供数据的组件。目前有上百个官方或者第三方 Exporter可供使用,具体请参见Exporter详情。
入门实践 当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。