检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建AOM指标告警规则 通过指标告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 创建方式 按照配置方式的不同,创建指标告警规则可分为:按全量指标创建、按Prometheus命令创建。 约束与限制 当指标告警规则的状
通过新增变量可在仪表盘页面查看或新增图表时,自定义添加过滤器,过滤展示监控数据。 约束与限制 系统预置的仪表盘模板都保存在“系统内置”分组下,包含容器、云服务、原生中间件、应用。预置仪表盘不允许删除或调整分组,仪表盘模板不支持创建。 系统预置的容器类型仪表盘需要在CCE集群下的“插件管理”中安装“kube
root|usr|var|proc|opt|srv)+\\s* vi /etc/vconsole.conf 直接修改系统文件可能会影响系统和服务的正常运行或使系统进入到不可恢复的状态 service xxx restart/stop command \\s*service\\s+
应用监控 应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。应用的类型包括系统应用和自定义应用。应用的类型包括系统应用和自定义应用,通过内置发现规则发现的是系统应用,通过自定义规则发现的是自定义应用。 在AOM的应用发现界面配置应用发现规则,可自动发现符合规则的应用
通过仪表盘监控Prometheus实例指标数据 通过系统预置的仪表盘模板,用户可以快速监控云服务类型和default类型Prometheus实例的指标数据,及时定位并发现资源数据存在的问题,提升运维效率。 前提条件 服务已接入云服务类型Prometheus监控并接入云服务,具体请参见Prometheus实例
使用cron表达式创建定时任务,提示参数错误 问题描述 在使用cron表达式创建定时运维任务时,系统提示参数错误。 可能原因 cron表达式未遵循Spring Cron语法。 定时任务的触发时间间隔小于30分钟。 操作步骤 检查创建定时运维任务时设置的cron表达式的语法,是否遵循了Spring
索功能可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。 在左侧导航栏中选择“日志 > 日志搜索”。 在“日志搜索”页面中选择日志页签(即组件、系统、主机)并按照界面提示设置日志查询条件。 支持分别搜索“组件”、“系统”、“主机”日志。
通过AOM您可监控主机的资源占用与健康状态,监控主机的磁盘、文件系统等常用系统设备,监控运行在主机上的业务进程或实例的资源占用与健康状态。 注意事项 一个主机最多可添加5个标签,且标签键不能重复。 不同主机可添加同一个标签。 通过创建CCE、ServiceStage集群时创建的主机,不支持添加自定义集群和别名。
主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。AOM既可监控通过创建CCE、ServiceStage集群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICAgent,否则AOM将无法监控)。同时,主机的IP地址支持IPv4。
选择“桶列表”页签,单击“添加日志桶”,输入日志桶名称和描述,并添加目标日志文件,然后单击“确认”。 “组件”页签下显示除系统组件外的其他组件日志文件。 “系统”页签下显示所有的系统日志文件。 “主机”页签下显示所有的主机日志文件。 更多日志桶操作 日志桶添加完成后,您还可执行表1中的操作。
查看采集任务 配置指标告警规则 按照配置方式的不同,创建指标告警规则可分为:按全量指标创建和按PromQL创建。 下面的操作以按全量指标创建为例,通过选择指标和设置条件,配置指标告警规则。 在左侧导航栏选择“告警管理 > 告警规则”,单击“创建”。 设置告警规则基本信息,具体的参数说明如表3所示。
控制台实时查看日志。 前提条件 已为应用添加组件和环境,详情请参见添加节点和添加环境。 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流,也可以在添加日志接入页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南。 约束与限制 如需使用“日志接
按全量指标创建和按PromQL创建。 下面的操作以按全量指标创建为例,通过选择指标和设置条件,配置指标告警规则。 在左侧导航栏选择“告警管理 > 告警规则”,单击“创建”。 设置告警规则基本信息,具体的参数说明如表5所示。 表5 基本信息填写说明 参数名称 说明 示例 规则名称
动规则,触发告警通知。 图1 分组流程 创建分组规则 用户最多可创建100条分组规则。 在左侧导航栏中选择“告警 > 告警降噪”。 在“分组规则”页签下单击 “创建分组规则”,设置规则名称、分组条件等信息,字段说明请参见表1。 图2 创建分组规则 表1 分组规则参数说明 类别 参数名称
在CTS事件列表查看云审计事件 操作场景 用户进入云审计服务创建管理类追踪器后,系统开始记录云服务资源的操作。在创建数据类追踪器后,系统开始记录用户对OBS桶中数据的操作。云审计服务管理控制台会保存最近7天的操作记录。 云审计控制台对用户的操作事件日志保留7天,过期自动删除,不支持人工删除。
指标分为系统指标和自定义指标。 系统指标:AOM提供的基础指标,例如:CPU使用率、CPU内核占用等。 自定义指标:您自己定义的指标。可参考如下两种方式上报自定义指标。 方式一:通过AOM提供的接口上报自定义指标,接口详见添加监控数据和查询监控数据。 方式二:在CCE创建容器应用
nux机器不能重启。 rm -f /root/install_uniagentd_self_OS.sh 在目标ECS弹性云服务器的操作列单击“创建镜像”去创建私有镜像,详细操作请参考创建镜像。 根据用户的使用需要,配置镜像信息。 在Windows环境打包镜像 用户在Windows
如果通过旧版方式安装UniAgent的主机是Windows操作系统,需在主机上手动执行重装UniAgent操作。 UniAgent暂时不提供自动升级,而是根据您的需求自主进行升级。 如果通过旧版方式安装UniAgent的主机是Windows操作系统,则需在主机上手动执行卸载UniAgent操作。
如果通过旧版方式安装UniAgent的主机是Windows操作系统,需在主机上手动执行重装UniAgent操作。 UniAgent暂时不提供自动升级,而是根据您的需求自主进行升级。 如果通过旧版方式安装UniAgent的主机是Windows操作系统,则需在主机上手动执行卸载UniAgent操作。
运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体验、如何将散落的日志进行关联分析、如何快速追踪问题。 AOM帮您解决 图2 一站式运维平台