检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源监控使用说明 满足内置发现规则的服务,安装ICAgent后该服务会自动被发现;对于不满足内置应用发现规则的服务,您则需配置应用发现规则。 资源监控使用说明如下: 图1 资源监控使用说明 父主题: 资源监控
通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 系统支持创建的阈值规则和事件类告警规则总计不能超过1000条,即创建的告警规则数量不能超过1000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。 父主题: 告警规则(新版)
标准输出配置 通过添加指定采集容器标准输出标签,用户可以指定采集pod下的对应容器名的标准输出日志。用户在pod的yaml中spec:template:metadata:annotations:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout:
日志管理使用说明 AOM支持容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。 使用该功能前首先要配置日志采集路径,详情请参考配置日志采集路径。 图1 日志管理使用说明 父主题: 日志管理
准化特定场景的运维场景变更。 服务场景 将作业、标准化运维发布成服务,用户无需感知底层操作逻辑,仅输入简单的信息即可自助完成特定运维场景。 参数库 在作业、标准化运维中定义的全局共享参数,支持字符串,主机列表类型。除了达到多步骤参数共享目的,可清晰的看到整个流程涉及的全部参数和用途。
通过AOM FullAccess策略对租户下子用户进行了权限控制,那么AOM FullAccess策略增加上述权限后,子用户也会展示上述云服务资源,您若仍有子用户云服务资源控制诉求,则您可自行进行自定义的子用户权限配置,从而达成子用户云服务资源展示控制效果。 父主题: 告警监控
告警管理使用说明 告警是指AOM自身或外部服务在异常情况或在可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装ICagent,详情请参考安装ICAgent,安装之后使用流程请参见图1。
] } 示例2:拒绝用户删除应用发现规则 拒绝策略需要同时配合其他策略使用,否则没有实际作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予AOM FullAccess的系统策略,但不希望用户拥有AOM FullAc
参数 是否必选 参数类型 描述 X-Auth-Token 是 String 从IAM服务获取的用户Token。获取方式请参见:获取Token。 Content-Type 是 String 消息体的类型(格式)。指定类型为“application/json”。 Enterprise-Project-Id
多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 例如一个并行条件下设置了两个串行条件,依次为“告警级别等于紧急”、“告警源等于AOM”,则告警级别为紧急的AOM告警会被筛选出来,并根据设置的告警行动规则执行告警通知操作。
主机监控 主机监控是针对主机的监控,通过主机监控您可以及时了解主机的资源使用情况、趋势和告警,使用这些信息,您可以快速响应,保证主机流畅运行。 主机监控的设计类似应用监控,主机的层级关系为:主机列表->主机详情。详情页面包含了当前主机上所发现的所有实例,显卡,网卡,磁盘,文件系统等信息。
u_usage) 该指标用于统计测量对象的CPU使用率。服务实际使用的与限制的CPU核数量比率。 0~100 百分比(%) 磁盘读取速率(aom_container_disk_read_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) 磁
管理。 环境标签 为已创建的应用环境添加标签,便于用户快速过滤和查找相同属性的应用环境。 资源监控 接入中心 快速接入需要监控的业务层、应用层、中间件层、基础设施层指标。 不支持 支持 仪表盘 将不同图表展示到同一个屏幕上,通过多种图表形式展示资源的指标、日志和性能数据。 部分支持
已为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。 注意事项 您最多可创建1000个告警行动规则,如果告警行动规则数量已达上限1000时,请删除不需要的行动规则。 操作步骤 在左侧导航栏中选择“告警 > 告警行动规则”,单击左上角的“创建告警行动规则”。
related_cloud_service String 关联的云服务。 related_cce_clusters Array of strings 关联的CCE集群。 related_prometheus_instances Array of strings 关联的Prom实例。 alarm_notification
APM指标数据未采集上来,可能有哪些原因? 如果APM探针刚接入,可以稍微等待几分钟后,就能看到数据。 如果显示数据采集被停止,可能的原因有: 实例级别停止,APM探针管理中采集被停止。 监控项级别停止,监控项状态列表某些监控项采集被人为停止。 APM控制台的“全局配置(系统管理 > 通用配置)”中字节码方式采集被停止。
查看场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 运维配置
去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 分组、抑制、静默、屏蔽需手动创建规则,具体的创建方式请参见创建分组规则、创建抑制规则、创建静默规则和创建告警屏蔽规则。 约束与限制 此模块只作用于消息通知部分,所有触发的告警和事件都可在“告警列表”页面查看。
括:正式、测试。 环境标签 为环境设置的一个属性,多个环境可能具有相同的的标签,通过标签可过滤显示需要的环境。同一个标签只能添加在本应用下的不同环境,不能跨应用添加。 资源绑定 将资源对象与应用下的环境建立关联关系,在同一个应用下资源对象实例可属于多个环境。 解绑资源 关联资源后
告警模板是一组以云服务为单位的告警规则组合,通过告警模板用户可对同一个云服务下的多个指标批量创建阈值告警规则、事件告警规则和PromQL告警规则。 约束与限制 系统支持创建的指标告警规则、事件告警规则、应用性能监控告警规则总计不能超过3000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。