检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用链查看微服务间调用关系。 管理APM探针启停状态 AOM支持管理APM探针启停的状态。 APM配置管理 AOM支持管理APM的访问密钥,设置Agent相关通用配置,以及查看探针的统计数量。 父主题: 应用监控
管理日志接入LTS规则 AOM支持本章为您介绍如何管理日志接入LTS规则,支持添加、查看、删除日志接入LTS的规则。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流,也可以在添加接入规则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南。
产品架构 AOM是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集
单击“确定”。 采集配置:对日志采集设置具体的采集规则。 路径配置:添加您需要收集的日志路径,LTS将按照配置的路径进行日志采集。 采集Windows事件日志:当选择Window主机采集日志时,需要开启“采集Windows事件日志”,并且可以设置“日志类型”、“首次采集时间偏移量”
安装文件包提示没有OBS权限。 可能原因 自动化运维需要访问凭证授权访问OBS,用来获取OBS中的文件包。 解决方法 请在左侧导航栏单击“自动化运维(日落)”,进入“设置 > 访问凭证”页面,检查是否已创建访问凭证,如果没有创建访问凭证,请新建访问凭证。 父主题: 运维管理(即将下线)
告警管理 如何区分告警和事件?
None 操作指导 应用运维管理 AOM 如何创建告警规则 04:10 创建告警规则
403 Forbidden 请求被拒绝访问。 返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。
分组规则的描述。最多不能超过1024个字符。 告警分组规则 分组条件 根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。 分组条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件,每个并行条件下可设置一个或多个告警行动规则。 多个串行条件之间是“和
行下钻分析,细粒度定位事件根因。 查看事件根因分析结果 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。 在页面右上角设置应用的时间范围,您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围。 在过滤器上方的下拉列表中选择需要查看的应用。
参数名称 说明 - 排序方式 设置数据的排序方式,默认为降序。 限制数量 设置TopN图表中显示的条形图数量,默认为5个。 展示维度 设置TopN图表中展示的指标维度。 柱宽 设置柱宽度,可选择auto、16、22、32、48、60,默认展示auto。 单位 设置展示数据的单位,默认单位为“%”。
当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
选择导出TXT格式日志后,本地会以.txt格式保存日志的日志内容。 JSON设置 鼠标悬浮在按钮上,单击“JSON设置”,在弹出的JSON设置页面中,设置格式化显示。默认开启格式化,JSON默认展开层级为2层。 开启格式化按钮:设置JSON默认展开层级,最大设置为10层。 关闭格式化按钮:对于JSON格式的日志,将不会格式化层级显示。
根源告警表示产生抑制的某类特定告警。 根源告警最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件。多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 若串行条件设置为“告警级别等于紧急”,则符合告警级别为紧急的告警会被筛选出来,作为根源告警。
在应用列表上方搜索框中设置过滤条件,可以实现应用列表过滤显示。 在页面右上角单击,通过选中/取消选中各展示项后的复选框,自定义列表项的展示/隐藏。 在页面右上角单击,根据需要在下拉列表中设置应用信息的统计条件。 设置时间范围,查看已设时间范围内应用。可通过如下两种方式设置时间范围: 方式
参数名称 说明 - 排序方式 设置数据的排序方式,默认为降序。 限制数量 设置TopN图表中显示的条形图数量,默认为5个。 展示维度 设置TopN图表中展示的指标维度。 柱宽 设置柱宽度,可选择auto、16、22、32、48、60,默认展示auto。 单位 设置展示数据的单位,默认单位为“%”。
域区分包括:华东、华南。按照DevOps流水线阶段区分包括:alpha,beta,gamma,product。 环境标签:环境标签是为环境设置的一个属性,多个环境可能具有相同的标签,通过标签可过滤显示需要的环境。同一个标签只能添加在本应用下的不同环境,不能跨应用添加。 资源绑定:
待静默的告警通知需符合的条件,即满足该条件的告警通知均会被屏蔽。 静默条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件。多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 若串行条件设置为“告警级别等于紧急”,则符合告警级别为紧急的告警通知会被屏蔽。
用率指标,然后在“条件”设置处设置维度名称为RDS for MySQL实例、RDS for PostgreSQL实例等RDS实例类型,并选择对应维度值,即可过滤显示出特定RDS实例类型的CPU使用率指标。 单击“新增指标”可多次添加监控指标,并为指标设置统计周期等信息。将光标移动
实例列表”。 在Prometheus实例列表中,单击目标CCE类型的Prometheus实例名称,进入该实例的详情界面。 在左侧导航栏单击“设置”,然后在“预聚合(Recording Rule)”区域单击“编辑RecordingRule.yaml”。 在弹出的对话框,删除默认模板并输入预聚合规则。