检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 支持的指标 AOM可以支持设置阈值告警的指标类型如下。 类型 指标举例 组件(进程) CPU内核总量、CPU内核占用、CPU使用率等
些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用自动化运维服务的其它功能。 本章节为您介绍对用户授权的方法,操作流程如图1所示。 前提条件 给用户组授权之前,请您了解用户组可以添加的自动化运维权
创建抑制规则 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效
配置预聚合规则 预聚合(Recording Rule)可以对落地的指标数据做二次开发。某些查询可能需要在查询端进行大量的计算,导致查询端压力过大,通过配置预聚合规则将计算过程提前到写入端,可减少查询端资源占用,尤其在大规模集群和复杂业务场景下可以有效的降低PromQL的复杂度,从而提高查询性能,解决用户配置以及查询慢的问题。
当您完成了安装ICAgent、配置服务发现规则等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 阈值告警最佳实践(新版) 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,
定时运维 “定时运维”页面展示所有定时任务的执行记录。您可以在这里创建定时任务,也可以管理已创建的定时任务。创建定时任务后,系统按确定时间或周期定时触发脚本执行、文件管理、服务场景以及作业管理等操作。定时任务单用户最多支持创建100个。 创建任务 登录AOM 2.0控制台。 在左
创建抑制规则 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,
本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格式统一,部分指标被重命名。本场景的C
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。
的告警设置告警行动规则。 取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。
快速查询日志 当您需要重复使用某一关键字搜索日志时,可以将其设置为快速查询语句。 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志流”。 在“原始日志”页面单击,设置快速查询参数,具体的参数说明如表1所示。 图1 创建快速查询 表1 快速查询参数说明 参数名称 说明
创建分组规则 使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并
式按天进行结算。具体扣费规则可以参考按需产品周期结算说明。 例如:按天结算的云服务器在2023/06/18 8:30删除资源,但是2023/06/18 8:00~9:00期间产生的费用,通常会在2023/06/19 0:00:00才进行扣费。 您可以在“费用中心 > 账单管理 >
免费体验AOM服务 在华为云学院沙箱实验室,您可以免费体验AOM服务,完成电子商城网站应用的一站式运维。体验地址: 使用AOM实现云端应用一站式运维。
账号的用途,请从下拉列表中选择。 账号类型 账号的类型,请从下拉列表中选择。 描述 账号的描述信息。 单击“是”,完成创建。 更多操作 账号创建完成后,您可以在账号列表页面查看账号信息,还可执行表2中的操作。 表2 相关操作 操作 说明 编辑账号 单击“操作”列的“编辑”。 删除账号 单击“操作”列的“删除”。
资源分组 AOM支持按企业项目以及资源细粒度对资源进行分类管理,帮助用户快速管理和使用资源。 资源分组最多可以创建100个。 创建资源分组 在左侧导航栏中选择“资源分组”,可查看资源分组的信息。 单击右上角的“创建资源分组”。 根据界面提示配置参数,具体如表1所示。 表1 配置参数
单击“确定”,完成创建。 更多操作 凭证创建完成后,您可以在凭证列表页面查看凭证信息,还可执行表2中的操作。 表2 相关操作 操作 说明 编辑凭证 单击“操作”列的“编辑”。 取消凭证 单击“操作”列的“取消凭证”,取消凭证后该凭证将不会显示,您可以新建凭证。 父主题: 设置
描述 环境的描述信息,最多可输入255个字符。 同一组件下最多可创建20个环境。 设置完成后,单击“确认”。 更多操作 环境创建完成后,您还可以执行表2中的操作。 表2 相关操作 操作 说明 编辑 在左侧树节点选中待操作的环境,单击。 删除 在左侧树节点选中待操作的环境,单击。 关联资源
标准输出配置 通过添加指定采集容器标准输出标签,用户可以指定采集pod下的对应容器名的标准输出日志。用户在pod的yaml中spec:template:metadata:annotations:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout:
时、近6小时、近1天、近1周、自定义时间段。 单击“执行查询”,查询相关日志。 默认以日志图表中设置的图表类型可视化展示日志数据,可以根据需要操作切换图表类型。 单击则以表格形式展示当前日志数据。 单击则以柱状图形式展示当前日志数据。 单击则以折线图形式展示当前日志数据。 单击则以饼图形式展示当前日志数据。