检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
到数据库中,其中Cassandra用来存储数据,Redis用来查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层 AOM提供告警、日志、监控、指标等基础运维服务,同时也提供异常检测与分析等AI服务。
程中,您需要用到账号、用户和密码等信息。 区域(Region) 从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云
管理CCE集群的ICAgent插件 AOM支持对您已购买的CCE(云容器引擎)集群下的主机批量执行ICAgent插件安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。
选择“桶列表”页签,单击“添加日志桶”,输入日志桶名称和描述,并添加目标日志文件,然后单击“确认”。 “组件”页签下显示除系统组件外的其他组件日志文件。 “系统”页签下显示所有的系统日志文件。 “主机”页签下显示所有的主机日志文件。 更多日志桶操作 日志桶添加完成后,您还可执行表1中的操作。 表1
管理CCE集群的ICAgent插件 AOM支持对您已购买的CCE(云容器引擎)集群下的主机批量执行ICAgent插件安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。
ORIGIN 虚拟机运行的时间 apm_JVMInfo_info_vmName_ORIGIN 虚拟机的名字 apm_JVMInfo_info_vmVendor_ORIGIN 虚拟机的供应商 apm_JVMInfo_info_vmVersion_ORIGIN 虚拟机的版本 单击“立
AOM的日志服务与LTS的日志服务有何区别? 云日志服务(Log Tank Service,简称LTS)可以提供日志收集、分析、存储等服务。用户可以通过云日志服务快速高效地进行设备运维管理、用户业务趋势分析、安全监控审计等操作。 AOM作为华为云服务可观测性分析统一入口,自身并不
\\s*rm\\s+.* rm test.txt 包含rm命令,可能造成系统特殊文件被恶意删除或修改 > file command \\s*>\\s+.* > file 命令中包含 > , 可能会清空文件内容 dd if=/dev/random of=/dev/sdxxx command
历史API 弹性伸缩(即将下线) 监控(即将下线)
采集路径如果配置的是目录,示例:/var/logs/,则只采集目录下后缀为“.log”、“.trace”和“.out”的文件;如果配置的是文件名,则直接采集对应文件,只支持文本类型的文件。更多关于日志采集路径的说明请参见:配置日志采集路径。 登录AOM控制台,在左侧导航栏中选择“配置管理 > 日志配置”,在“配置中心
等待手工单击重试或跳过此步骤。 文件管理类型 文件包名称 文件包名称,下拉列中选择文件包名称。下拉框只展示上线的文件包名称,未上线文件包名称不显示。 版本号 软件版本信息,根据选定的文件包名称自动获取。 操作类型 操作类型,包括安装和卸载两种类型。 目标存储路径 可通过${var_name}方式引用全局变量的字符串参数。
、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式,能够满足企业对权限最小化的安全管控要求。例如:针对ECS服务,管理员能够控制IAM用户仅能对某一类云服务器资源进行指定的管理操作。多数细粒度策略以API接口为粒度进行权限拆分,AOM支持的API授权项请参见策略和授权项说明。
在CCE控制台的工作负载页面找到通过helm部署的pod记录,然后对比helm部署pod的yaml文件和直接在CCE控制台部署pod的yaml文件,发现helm部署pod的yaml文件中缺少env参数。 图1 两个yaml文件对比 解决方法一 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“工作负载
) 该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。 0~100 百分比(%) NPU存储使用量(aom_container_npu_memory_used_megabytes) 该指标用于统计测量对象已使用的NPU存储。 ≥0 兆字节(MB) NPU使用率(a
创建AOM事件告警规则 通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 约束与限制 当服务的资源数据满足事件条件时,如需使用企业微信、钉钉、飞书、语音、welink、邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。
应用发现最佳实践 应用发现概述 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。
CCE实例,并在Prometheus实例中一键接入容器监控。 针对虚机场景:虚机、虚机上的自建中间件等资源指标存储在Prometheus for ECS类型的实例中。 如果需要关联分析,需要先在AOM中创建Prometheus for ECS实例,并在AOM的接入中心安装Node Exporter或自建中间件Exporter。
APM)。 Prometheus 通用实例 适合已自建了Prometheus Server,但需要通过远端存储(Remote Write)方式来解决Prometheus存储的可用性和可扩展性场景。具体操作请参见:配置Prometheus 通用实例接入(AOM)。 KAFKA协议
没有消息通知服务的访问权限? 以IAM用户登录AOM,当创建或修改阈值规则、通知规则、静态阈值模板时,“选择主题”参数下提示:“抱歉,您没有消息通知服务的访问权限”,如下图所示。 问题分析 原因:该问题是由于您是以IAM用户登录AOM,但IAM用户没有消息通知服务的访问权限导致的。
您可以进入AOM的容器监控页面,在工作负载的监控视图里查看服务在各个时间的状态值,0代表正常,非0代表异常。 父主题: 常见使用问题