检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
降噪等场景。详细说明请参见标签和标注。 如您的组织已经设定AOM服务的相关标签策略,则需按照标签策略规则添加告警标签。标签如果不符合标签策略的规则,则可能会导致添加标签失败,请联系组织管理员了解标签策略详情。 告警标注 单击添加告警标注。告警标注为告警非标识性属性,key:val
降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 功能说明 告警降噪功能分为分组、去重、抑制、静默、屏蔽部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 分组、抑制、静默、屏蔽需手动创建规则,具体的创建方式请参见创建
创建消息模板 AOM提供消息模板功能,可通过创建消息模板自定义配置通知消息,当AOM触发已设定的告警通知策略时,可通过此功能以您自定义消息模板的邮件、短信、企业微信、钉钉、语音、HTTP或HTTPS形式通知指定的人员。如果您未创建任何消息模板,则采用默认消息模板。 创建消息模板 在左侧导航栏中选择“告警
服务场景会按照查看场景分类展现对应的已上架的工具卡片,可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作。如果不需要对卡片做下架操作,请参考自动化运维自定义策略,拒绝卡片下架操作。具体操作如表1。 表1 相关操作 操作 说明 收藏卡片 单击待收藏卡片上的。 下架卡片 单击卡片右上角的并选择“下架”。
弹性伸缩(即将下线) 创建策略 删除策略 更新策略 查看策略列表 查看单个策略 更新策略组属性 查询策略组属性 父主题: 历史API
6版本、EulerOS 2.5。 以root用户登录CCE节点,执行docker info | grep 'Storage Driver'命令查看docker存储驱动类型。如果执行结果为“Device Mapper ”,表示驱动类型为Device Mapper ,则支持查看磁盘分区thinpool指标。如果执行结果不为“Device
AM用户仅能对某一类云服务器资源进行指定的管理操作。多数细粒度策略以API接口为粒度进行权限拆分,AOM支持的API授权项请参见策略和授权项说明。 如表1所示,包括了AOM的所有系统权限。 表1 AOM系统权限 策略名称 描述 类别 依赖系统权限 AOM FullAccess A
属性,key:value键值对格式,主要应用于告警通知、消息模板等场景。本示例可不填写。 - 设置告警通知策略。具体参数说明请参见表4。 图7 告警通知 表4 告警通知策略填写说明 参数名称 参数说明 示例 通知场景 设置发送告警通知的场景。系统默认选择“告警触发时”和“告警恢复时”。
定时任务的时区,可以在下拉列表中选择正确的时区。 执行策略 定时任务的执行策略,包含以下三种: 单次执行:在设置的时间执行一次操作。 简单周期执行:根据设置的时间周期循环执行。 周期执行(Cron表达式):根据设置的Cron表达式执行操作。 执行时间 定时任务执行的具体时间。 执行周期 “执行策略”为“简单周期执行”才需要设置。
应用之间的依赖关系复杂,难以梳理。 调用链路长,排查和定位群体困难。 接口调用、数据库调用关系复杂,管理难度大。 解决方案 AOM提供大型分布式应用异常诊断能力,当应用出现崩溃或请求失败时,通过应用拓扑+调用链下钻能力分钟级完成问题定位。 基于应用拓扑自助发现,定位性能瓶颈。 真实
API模块、PromQL查询。 静态文件配置和动态发现机制发现监控对象,实现轻松迁移及接入。 数据规模无上限 凭借云存储能力,数据存储无上限,不再受限于本地容量。云端分布式存储保障数据可靠性。 通过Prometheus实例 for 多账号聚合实例将多个资源账号的指标数据汇聚到一个Prometheus实例,实现统一监控。
提前将监控指标配置成告警策略模版,以便在创建不同的告警规则时进行引用。 告警模版通常应用于当用户拥有多种云服务资源时,提前将这些资源的告警策略配置到一个或多个告警模版中,在配置告警规则时直接引用。对于使用模版创建的告警规则,可直接在模版中修改告警策略,会直接生效于使用该模版创建
ups:get”,“astrocanvas:*:*”细粒度权限,若您之前通过AOM FullAccess策略对租户下子用户进行了权限控制,那么AOM FullAccess策略增加上述权限后,子用户也会展示上述云服务资源,您若仍有子用户云服务资源控制诉求,则您可自行进行自定义的子用
等多视角下钻分析指标、日志、告警数据,直击异常。 精准告警 构建指标告警、事件告警、日志告警的统一告警体系,提供分组、抑制和静默等告警降噪策略,结合告警通知和订阅等功能,帮助用户从容应对海量告警风暴,快速检测和修复业务告警。 统一可视化 支持对多种数据源,在同一个仪表盘中统一监控
百分比(%) NPU存储容量(aom_node_npu_memory_free_megabytes) 该指标用于统计测量对象的NPU存储容量。 >0 兆字节(MB) NPU存储使用率(aom_node_npu_memory_usage) 该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。
事件类告警的触发策略。 累计触发:某个监控周期内达到累计次数则触发告警行动规则。 立即触发:满足筛选条件立即产生告警。 图2 设置告警规则 设置告警通知策略。告警通知策略有两种方式,请根据需要选择: 直接告警:满足告警条件,直接发送告警。 需要设置是否启用告警行动规则。启用后,系统根据关联S
AOM已对接SMN,单击“创建主题”,在SMN界面设置通知策略。如果均已设置,请跳过该步骤。 创建一个主题,操作详见创建主题。 例如,创建名称为Topic1的主题。 设置主题策略,操作详见设置主题策略。 设置主题策略时,“可发布消息的服务”必须选择“APM”,否则会导致通知发送失败
需使用邮件或短信等方式发送通知,请参考下面操作在SMN界面设置通知策略。如不需接收邮件或短信通知,请跳过下面操作。具体操作如下: 创建一个主题,操作详见创建主题。 设置主题策略,操作详见设置主题策略。 设置主题策略时,“可发布消息的服务”必须选择“APM”,否则会导致通知发送失败。
key1变量获取告警标签信息,具体请参见消息模板变量说明。 如您的组织已经设定AOM服务的相关标签策略,则需按照标签策略规则添加告警标签。标签如果不符合标签策略的规则,则可能会导致添加标签失败,请联系组织管理员了解标签策略详情。 告警标注说明 告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。
设置卡片 单击卡片右上角的并选择“设置”,可以对该卡片任务设置审批配置和执行策略。 审批配置 选择是否开启人工审核开关,默认不打开。 开启人工审核后,需要选择审批人。 审批通知方式当前支持邮件和短信2种方式。 执行策略 选择是否开启分批发布开关,默认不打开。 每批发布:开启分批发布后需填写每批发布数量。