检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Profiler依赖perf_event_open的系统调用,但因为Linux kernel的Syscall安全策略(seccomp)控制,可能会禁止进程调用特定Syscall。 Docker环境:执行以下命令运行容器。如需配置更精细化的系统调用控制,请参见https://docs.docker
约束与限制 操作系统使用限制 AOM支持多个操作系统,在购买主机时您需选择AOM支持的操作系统,详见表1,否则无法使用AOM对主机进行监控。 表1 AOM支持的操作系统及版本 操作系统 版本 SUSE SUSE Enterprise 11 SP4 64bit SUSE Enterprise
文件系统指标及其维度 表1 文件系统指标 指标名称 指标含义 取值范围 单位 可用磁盘空间(aom_node_disk_available_capacity_megabytes) 还未经使用的磁盘空间。 ≥0 兆字节(MB) 磁盘空间容量(aom_node_disk_capacity_megabytes)
AOM有哪些使用限制? 操作系统使用限制 AOM支持多个操作系统,在购买主机时您需选择AOM支持的操作系统,详见表1,否则无法使用AOM对主机进行监控。 表1 AOM支持的操作系统及版本 操作系统 版本 SUSE SUSE Enterprise 11 SP4 64bit SUSE
查询系统中已有服务发现规则 功能介绍 该接口用于查询系统当前已存在的服务发现规则。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/inv/servicediscoveryrules 表1 路径参数 参数 是否必选 参数类型 描述 project_id
数据多写 通过数据多写功能,可以实现跨VPC的访问,而不必暴露服务端相关的网络信息,以更加安全、可靠的方式将监控数据上报到自建Prometheus中。 前提条件 服务已接入ECS类型Prometheus监控,具体请参见Prometheus实例 for ECS。 服务已接入云服务类
扩展名(.log、.trace和.out)限制;被采集日志文件必须为文本文件。 2019-8-30 容器指标增加对“文件系统可用”“文件系统容量”和“文件系统使用率”的支持。 主机和容器指标增加对NPU指标的支持。 2019-8-21 支持统计分析APP的用户运营数据,便于您更有针对性的开展运营活动。
的情况下,监控页面内存使用率,虚拟内存使用率相同。 物理磁盘已使用总容量和物理磁盘总容量指标仅统计本地磁盘分区的文件系统类型,不统计主机通过网络形式挂载的文件系统(juicefs、nfs、smb等)。 表2 主机指标维度 维度 说明 clusterId 集群ID。 clusterName
将AOM仪表盘详情页面嵌入用户自建系统 AOM支持将仪表盘详情页界面嵌入到客户自建系统。通过统一身份认证服务IAM的联邦代理机制实现用户自定义身份代理,再将登录链接嵌入至客户自建系统实现无需在华为云官网登录就可在自建系统界面查看AOM仪表盘详情页。 应用场景 该功能主要用于用户可以在自建系统免密登录AO
了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行;应用资源管理能将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设;日志接入可以帮您在AOM控制台实时查看日志。
安装ICAgent过程中,系统提示“no crontab for root”是什么原因? 问题描述 安装ICAgent过程中,系统提示“no crontab for root”。 图1 安装ICAgent 可能原因 安装ICAgent的脚本会同时安装crontab计划任务,该提示信息表示当前没有root的计划任务。
第三方云厂商/IDC/华为云其它Region自建Prometheus对接到AOM Prometheus实例 背景信息 云上用户经常会遇到多云或者跨region采集自建Prometheus场景,典型场景如:将自建IDC或者第三方云厂商的自建Prometheus对接到AOM Prometheus实例。
通过多副本横向扩展均衡分解采集任务,实现动态扩缩,解决开源水平扩展问题。 高可用性 双副本:数据采集、处理和存储组件支持多副本横向扩展,核心数据链路高可用。 水平扩展:基于集群规模可直接进行弹性扩容。 父主题: Prometheus监控简介
Namespace: "PAAS.CONTAINER", MetricName: "cpuCoreLimit", IsTurnOn: &isTurnOnAlarmRuleParam, EvaluationPeriods: int32(1), Dimensions:
搜索应用时,系统提示“AOM.11007006: get policy list failed.” 问题描述 在应用资源管理的“首页”界面进行资源检索时,系统提示“AOM.11007006: get policy list failed.” 可能原因 当前用户账号已欠费或者被冻结,导致没有应用资源管理的操作权限。
子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方式对告警子集合并,合并后的告警可以关联行动规则,触发告警通知。
该指标用于统计测量对象文件系统的容量。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。 ≥0 兆字节(MB) aom_container_filesystem_usage 文件系统使用率 该指标用于统计测量对象文件系统使用率。实际使用量与文件系统容量的百分比。仅支持1
降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 实践场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多,需要从众多告警中快速及时发现故障,全面掌握应用。 解决方案 AOM通过设置告警规则,实时监控环境中主机
耗时明细展示调用方法,耗时时间,“下钻”操作。 单击“下钻”展示某个调用方法的详细信息。 图3 下钻 页面右侧展示默认观测项目,包括:Parameters、Return Object、Thrown Exception以及Target。 选择重载方法:在下拉菜单中,重新选择一个方法。 设置过滤条件:设置方法执行条件,过滤出符合条件的方法记录。