检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
工具市场 工具市场会按照场景分类展现各功能的工具卡片,目前支持以下类型: 通用场景:脚本管理、文件管理。 云服务场景:启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载。 软件部署:暂时为空。 日常巡检:暂时为空。 故障处理:清理磁盘空间。
静默都可能导致资源运行异常,您可参考如下指导进行分析和修复。 亚健康 当有级别为次要或提示的告警时资源状态为亚健康。 修复建议:请在告警界面参考告警详细信息处理告警。 异常 当有级别为紧急或重要的告警时资源状态为异常。 修复建议:请在告警界面参考告警详细信息处理告警。 通道静默
通用场景默认展现文件管理、脚本管理工具卡片,也可以根据自身需求定制相应的工具卡片。可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作,具体操作参见脚本管理、文件管理。 云服务场景 云服务场景展现启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载已上架的工具卡片。
什么是应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化
支持将CCE日志直接接入LTS。 5.12.120 增加进程的最大句柄数指标。 支持LTS的podlb域名的切换能力。 5.12.111 新增线程指标、修复“获取lvs磁盘分区指标失败”问题。 5.12.100 上报内存指标增加内存workingset使用量、内存workingset使用率 容器采集支持通过标签区分stderr
"alarm_probableCause_zh_cn" : "可能原因", "alarm_fix_suggestion_zh_cn" : "修复建议", "message" : "告警详情" }, "attach_rule" : { } } ] } 响应示例
运维管理(日落) 概述 开通自动化运维 权限管理 服务场景 定时运维 任务管理 参数库 作业管理 脚本管理 文件管理 设置 工具市场 高危命令说明
、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。 告警清除:支持单个、批量清除告警。 告警详情:在告警详情中查看告警对象的信息和修复建议,所有的告警都提供修复建议。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警列表”。 单击“告警”页签,查看告警信息。
多步骤参数共享目的,可清晰的看到整个流程涉及的全部参数和用途。 OS账号 用于执行脚本和文件管理的操作系统账户。 工具市场 服务默认提供的按照场景分类展现各功能的工具卡片,用户可根据需要控制场景从服务市场中上下架和基于安全考虑配置任务的审批流程。 父主题: 基本概念
"alarm_probableCause_zh_cn" : "可能原因" "alarm_fix_suggestion_zh_cn" : "修复建议" } } 父主题: 告警降噪
${alarm_probableCause_zh} 附加信息 其他附加的告警描述信息,例如指标名称、告警规则状态的变化等。 ${message} 修复建议 修复建议,非自定义上报则展示"NA" ${alarm_fix_suggestion_zh} 自定义标注 标注扩展字段 $event.annotations
"alarm_probableCause_zh_cn" : "可能原因", "alarm_fix_suggestion_zh_cn" : "修复建议" } } 父主题: 告警降噪
提供创建脚本等功能,并支持对脚本进行版本管理。 文件管理 提供创建文件包等功能,并支持对文件包进行版本管理。 设置 提供账号、访问凭证、场景分类管理功能。 工具市场 提供不同的原子服务场景,并且可以对各原子服务场景卡片进行上下架管理。 父主题: 运维管理(日落)
在控制台查看不到日志怎么办? 问题描述 在AOM控制台查不到日志。 可能原因 未安装ICAgent日志采集工具。 采集路径配置错误。 AOM控制台上的“日志采集开关”未开启。 AOM控制台上的“超额继续采集日志”开关未开启。 当前账号欠费,故采集器停止采集。 日志流写入速率和单行日志长度超出使用限制。
表3 更多设置 参数类别 参数名称 说明 审批配置 人工审核 选择是否开启人工审核开关,默认不打开。 审批配置不允许更改,如需更改,需在工具市场中对该原子服务卡片进行审批配置。 审批人设置 开启人工审核后,需要选择审批人。 通过选择“主题”的方式配置审批人,您需要在消息通知服务
构建指标告警、事件告警、日志告警的统一告警体系,提供分组、抑制和静默等告警降噪策略,结合告警通知和订阅等功能,帮助用户从容应对海量告警风暴,快速检测和修复业务告警。 统一可视化 支持对多种数据源,在同一个仪表盘中统一监控与分析,并以折线图、数字图等形式多样化、可视化呈现,帮助用户快速监控资源、及时获取数据发展趋势和制定决策。
操作 说明 查看事件统计数据 单击,可通过柱状图查看在指定时间范围内和搜索条件下事件的统计数据。 查看事件详情 单击事件名称可查看事件详情和修复建议。 父主题: 告警管理
资源标识 触发告警或事件对应的具体资源。 ${resources} 自定义标签 标签扩展字段。 $event.metadata.key1 修复建议 修复建议,非自定义上报则展示"NA"。 ${alarm_fix_suggestion_zh} 自定义标注 标注扩展字段。 $event.annotations
以图表的形式展示指标源、日志源以及系统图表信息。 组件监控 在组件层,主要监控组件的告警信息。支持从组件层面查询活动告警与历史告警,快速修复告警问题。 图1 组件监控 环境监控 在环境页面,以环境概览、日志、性能、调用链、告警的形式,深度的监控和分析环境的核心指标。针对预发环境
非洲-约翰内斯堡区域不开放。) 健康中心 集群健康诊断基于容器运维专家经验对集群健康状况进行全面检查,能够及时发现集群故障与潜在风险并给出修复建议。详情请参见健康中心。 监控中心 监控中心提供容器洞察、健康诊断、仪表盘等功能。容器洞察功能提供容器视角的可视化视图,支持集群、节点、