检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建关闭ECS实例任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“服务场景”,在服务场景页面单击“关闭ECS实例”卡片,或单击卡片右上角的选择“创建任务”,进入创建关闭ECS实例任务页面。 填写基本信息,具体的参数说明请参见表1。
创建重启RDS实例任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“服务场景”,在服务场景页面单击“重启RDS实例”,或单击卡片右上角的选择“创建任务”,进入创建重启RDS实例任务页面。 填写基本信息,具体的参数说明请参见表1。
您需要先在IAM服务为用户自定义创建身份代理并创建委托,然后再将AOM仪表盘图表页面嵌入用户自建系统。 使用管理员账号DomainA(该账号仅供参考,请以实际账号为准)登录统一身份认证服务控制台。 在用户组页面创建IAM用户组(用户组名以GroupC为例)并授予全局服务中的Agent
创建重启CCE工作负载任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“服务场景”,在服务场景页面单击“重启CCE工作负载”卡片,或单击卡片右上角的选择“创建任务”,进入创建重启CCE工作负载任务页面。 填写基本信息,具体的参数说明请参见表1。
日志文件。 图3 查看容器服务日志文件 查看容器服务日志并进行分析 在左侧导航栏中选择“日志 > 日志搜索”,在“组件”页签中选择对应的集群与命名空间,选择某个组件及已配的文件名称,查看采集到的日志并进行分析。详细操作请参见搜索日志。 图4 查看容器服务日志并进行分析 父主题: 配置日志采集路径
AlarmRuleTemplateSpecWithCloudService 参数 参数类型 描述 related_cloud_service String 关联的云服务。 related_cce_clusters Array of strings 关联的CCE集群。 related
suffix}/v1/{project_id}/api/v1/read' Remote Read地址的参数说明如下: region_name:指定承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同。 Site domain name suffix :站点域名后缀,例如“myhuaweicloud.com”。
创建修改ECS非管理员密码任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“服务场景”,在服务场景页面单击“修改ECS非管理员密码”卡片,或单击卡片右上角的选择“创建任务”,进入创建修改ECS非管理员密码任务页面。 填写基本信息,具体的参数说明请参见表1。
通过系统预置的仪表盘模板,用户可以快速监控云服务类型和default类型Prometheus实例的指标数据,及时定位并发现资源数据存在的问题,提升运维效率。 前提条件 服务已接入云服务类型Prometheus监控并接入云服务,具体请参见Prometheus实例 for 云服务。 约束与限制 目前仅d
通过AOM查看事件巡检数据 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小
资源监控使用说明 满足内置发现规则的服务,安装ICAgent后该服务会自动被发现;对于不满足内置应用发现规则的服务,您则需配置应用发现规则。 资源监控使用说明如下: 图1 资源监控使用说明 父主题: 资源监控
使用场景 指标数据 请参见添加指标图表 监控业务层、应用层、Prometheus 中间件、Prometheus 运行环境、Prometheus 云服务、开源监控系统、Prometheus API/SDK接入和Prometheus 自定义插件接入的指标。 日志数据 请参见添加日志图表 监控
日志管理使用说明 AOM支持容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。 使用该功能前首先要配置日志采集路径,详情请参考配置日志采集路径。 图1 日志管理使用说明 父主题: 日志管理
单击事件卡片或列表进入该事件详情页面,查看各类型事件的根因分析。 应用服务整体平均响应时间突增:基于应用的调用链数据,针对应用粒度提供下钻分析,分析应用下每个组件的平均时延以快速定位根因,找到导致应用整体RT突增的具体组件。 图1 应用服务整体平均响应时间突增 应用服务整体错误率突增:基于应用的调用链数据,针
选择终端节点服务。请从下拉列表选择合适的终端节点服务。 选择的终端节点服务需要和自建Prometheus是同一个VPC。目前仅支持后端资源类型为云服务器、弹性负载均衡类型的终端节点服务。 添加白名单权限。 单击“一键添加至白名单”将AOM提供的账号ID,添加至终端节点服务的白名单中。
通过AOM查看故障传播链 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。
查看场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 运维配置
进行监控,以便了解Memcached服务是否运行正常,排查Memcached故障等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Memcached运行状态。本文为您介绍如何使用Prometheus监控服务Memcached。 约束与限制 为了
AOM支持查看CCE类型、ECS类型、云服务类型、通用实例、APM类型与default类型Prometheus实例的指标,以及新增指标和废弃指标。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 约束与限制 目前仅default类型、CCE类型、云服务类型、
命令,可能会停机导致影响系统或服务的正常运行 reboot command \\s*reboot\\s* reboot 包含reboot命令,可能重启导致影响系统或服务的正常运行 halt command \\s*halt\\s* halt 包含halt命令,可能关机导致影响系统或服务的正常运行 Fork