检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基础指标:IEF指标 介绍IEF服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。IEF服务的指标上报到AOM后,系统会根据指标映射规则将IEF指标转换后,呈现在AOM控制台的“指标浏览”界面。 表1 IEF服务监控指标 指标类别 分类 AOM呈现的指标 IEF上报的指标
AOM自定义策略 如果系统预置的AOM权限不能满足您的授权要求,您可以创建自定义策略。自定义策略中可以添加的授权项(Action),请参考策略和授权项说明。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作
加密保护。 采集器部署 在弹性云服务器 ECS上手动部署ICAgent过程中,安装命令中会使用到您的AK/SK作为输入参数,安装前请您关闭系统的历史记录收集,以免泄露隐私。安装后ICAgent会加密存储您的AKSK,有效保护敏感信息。 容器监控 在CCE容器监控场景下,AOM的采
AOM自定义策略 如果系统预置的AOM权限不能满足您的授权要求,您可以创建自定义策略。自定义策略中可以添加的授权项(Action),请参考策略和授权项说明。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作
执行命令将install_uniagentd_self_OS.sh脚本下载到弹性云服务器上的/root 目录下: 下载命令的拼接规则:wget https://aom-uniagent-{region_id}.{obs_domain}/install_uniagentd_self_OS.sh 以华北-北京四区域为例:
维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体
使用cron表达式创建定时任务,提示参数错误 问题描述 在使用cron表达式创建定时运维任务时,系统提示参数错误。 可能原因 cron表达式未遵循Spring Cron语法。 定时任务的触发时间间隔小于30分钟。 操作步骤 检查创建定时运维任务时设置的cron表达式的语法,是否遵循了Spring
在CTS事件列表查看云审计事件 操作场景 用户进入云审计服务创建管理类追踪器后,系统开始记录云服务资源的操作。在创建数据类追踪器后,系统开始记录用户对OBS桶中数据的操作。云审计服务管理控制台会保存最近7天的操作记录。 云审计控制台对用户的操作事件日志保留7天,过期自动删除,不支持人工删除。
已购买弹性云服务器ECS作为跳板机。 满足AOM支持的操作系统及版本,支持amd64处理器架构。 弹性云服务器已绑定弹性IP地址。 确保本地浏览器的时间与弹性云服务器的时区、时间一致。 注意事项 非华为云上的服务器安装ICAgent时,系统自动生成的跳板机转发命令不包含域名信息,即不支持通过域名方式安装ICAgent。
的情况下,监控页面内存使用率,虚拟内存使用率相同。 物理磁盘已使用总容量和物理磁盘总容量指标仅统计本地磁盘分区的文件系统类型,不统计主机通过网络形式挂载的文件系统(juicefs、nfs、smb等)。 表2 主机指标维度 维度 说明 clusterId 集群ID。 clusterName
MySQL)、云数据库(RDS for PostgreSQL)、云数据库(RDS for SQL Server)、应用与数据集成平台(ROMA Connect)、视频直播服务(Live)、消息通知服务(SMN)、安全云脑 SecMaster(SecMaster)、应用管理与运维平台(ServiceStage
xxxxx。 图1 报错信息 原因分析 该主机无法解析obs域名,导致无法下载UniAgent的安装脚本。 解决方法 指导用户为Linux系统的ECS主机配置DNS域名解析,并添加安全组,以解决下载UniAgent安装脚本出现域名无法解析问题。 修改ECS主机的DNS配置有两种方
例如,设置连续周期为“2”,则表示连续2个周期不满足告警条件,恢复告警。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。默认只监控一个周期,最多可监控5个连续周期指标数据。 系统处理方式包括:超限阈值并发送告警、数据不足并发送事件、保持上一个状态、正常并发送清除告警。
该指标用于统计测量对象文件系统的容量。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。 ≥0 兆字节(MB) aom_container_filesystem_usage 文件系统使用率 该指标用于统计测量对象文件系统使用率。实际使用量与文件系统容量的百分比。仅支持1
参数名称 说明 任务名称 自定义任务名称。 最多可输入64个字符,只能由大小写字母、数字、下划线、中划线以及中文字符组成。默认勾选“自动命名”,系统将自动生成任务名称。 企业项目 选择所属的企业项目。 平台 选择任务运行平台,目前仅支持Linux。 清理规则 需填写磁盘清理的目录、待删
态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘和全面托管的Prometheus服务。 Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活查询语句PromQL以及数据可视化展示等。更多信息请参见Prometheus官方文档。 Prometheu
磁盘分区指标 当主机类型为“CCE”时,可以查看磁盘分区指标,支持的系统为:CentOS 7.6版本、EulerOS 2.5。 以root用户登录CCE节点,执行docker info | grep 'Storage Driver'命令查看docker存储驱动类型。如果执行结果为“Device
执行脚本任务失败,提示 :agent not found 问题现象 在ECS执行脚本任务时失败,系统提示“agent not found”。 可能原因 没有正确安装UniAgent。 UniAgent为非“运行中”状态。 解决方法 检查UniAgent的状态,UniAgent状态
降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多,无法及时从众多告警中及时发现故障,全面掌握应用情况。 解决方案 下面以监控ELB业务层全量指标为例说明,如何使用分组规则清除告警风暴。
示例 通知场景 设置发送告警通知的场景。系统默认选择“告警触发时”和“告警恢复时”。 告警触发时:满足告警触发条件,则以邮件、短信等方式发送告警通知给指定人员。 告警恢复时:满足告警恢复条件,则以邮件、短信等方式发送告警通知给指定人员。 保持系统默认选择 告警方式 直接告警:满足告警