检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过调用链查看微服务间调用关系 在企业微服务之间调用复杂的场景下,Agent会抽样一些请求,拦截对应请求及后续一系列的调用信息。您可以通过调用链查看微服务间调用关系。 通过调用链查看微服务间调用关系 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 调用链”,进入调用链页面。
创建重启CCE工作负载任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“服务场景”,在服务场景页面单击“重启CCE工作负载”卡片,或单击卡片右上角的选择“创建任务”,进入创建重启CCE工作负载任务页面。 填写基本信息,具体的参数说明请参见表1。
创建重启RDS实例任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“服务场景”,在服务场景页面单击“重启RDS实例”,或单击卡片右上角的选择“创建任务”,进入创建重启RDS实例任务页面。 填写基本信息,具体的参数说明请参见表1。
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
suffix}/v1/{project_id}/api/v1/read' Remote Read地址的参数说明如下: region_name:指定承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同。 Site domain name suffix :站点域名后缀,例如“myhuaweicloud.com”。
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
创建修改ECS非管理员密码任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“服务场景”,在服务场景页面单击“修改ECS非管理员密码”卡片,或单击卡片右上角的选择“创建任务”,进入创建修改ECS非管理员密码任务页面。 填写基本信息,具体的参数说明请参见表1。
通过系统预置的仪表盘模板,用户可以快速监控云服务类型和default类型Prometheus实例的指标数据,及时定位并发现资源数据存在的问题,提升运维效率。 前提条件 服务已接入云服务类型Prometheus监控并接入云服务,具体请参见Prometheus实例 for 云服务。 约束与限制 目前仅d
FullAccess策略对租户下子用户进行了权限控制,那么AOM FullAccess策略增加上述权限后,子用户也会展示上述云服务资源,您若仍有子用户云服务资源控制诉求,则您可自行进行自定义的子用户权限配置,从而达成子用户云服务资源展示控制效果。 创建消息模板 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理
资源监控使用说明 满足内置发现规则的服务,安装ICAgent后该服务会自动被发现;对于不满足内置应用发现规则的服务,您则需配置应用发现规则。 资源监控使用说明如下: 图1 资源监控使用说明 父主题: 资源监控
通过AOM查看事件巡检数据 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小
实例数据 将云服务或CCE集群接入Prometheus实例后,即可通过Grafana查看AOM中相关集群或云服务的指标数据。 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。 服务已接入可观测Prometheus
管理日志接入 AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中“接入管理”功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 约束与限制 需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“接入管理”功能。
单击事件卡片或列表进入该事件详情页面,查看各类型事件的根因分析。 应用服务整体平均响应时间突增:基于应用的调用链数据,针对应用粒度提供下钻分析,分析应用下每个组件的平均时延以快速定位根因,找到导致应用整体RT突增的具体组件。 图1 应用服务整体平均响应时间突增 应用服务整体错误率突增:基于应用的调用链数据,针
日志管理使用说明 AOM支持容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。 使用该功能前首先要配置日志采集路径,详情请参考配置日志采集路径。 图1 日志管理使用说明 父主题: 日志管理
查看场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 运维配置
日志设置 AOM作为华为云服务可观测性分析统一入口,自身并不具有日志服务功能,AOM 2.0控制台中日志设置相关功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 约束与限制 需要先购买云日志服务的相关功能,才可使用AOM 2.0控制台中日志设置相关功能。
选择终端节点服务。请从下拉列表选择合适的终端节点服务。 选择的终端节点服务需要和自建Prometheus是同一个VPC。目前仅支持后端资源类型为云服务器、弹性负载均衡类型的终端节点服务。 添加白名单权限。 单击“一键添加至白名单”将AOM提供的账号ID,添加至终端节点服务的白名单中。
通过AOM查看故障传播链 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。
除对应的成员账号。 接入云服务:从云服务下拉列表中选择需要监控的一个或多个云服务。 数据存储:组织内子账号指标数据接入Prometheus For聚合实例后,子账号保留数据。系统默认不选择。 添加云服务支持的相关指标:单击“新增指标”,依次为接入的云服务添加相关指标。 图1 账号接入界面