检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
AOM的日志绕接能力是使用copytruncate方式实现的,如果选择了设置,请务必保证您写日志文件的方式是append(追加模式),否则可能出现文件空洞问题。 当前主流的日志组件例如Log4j、Logback等均已经具备日志文件的绕接能力,如果您的日志文件已经实现了绕接能力,则无需设置。否则可能出现冲突。
产生阈值告警。 日志管理 AOM提供强大的日志管理能力。日志检索功能可帮您快速在海量日志中查询到所需的日志;日志转储帮您实现长期存储;通过创建日志统计规则实现关键词周期性统计,并生成指标数据,实时了解系统性能及业务等信息;通过配置分词可将日志内容按照分词符切分为多个单词,在日志搜索时可使用切分后的单词进行搜索。
静态文件配置和动态发现机制发现监控对象,实现轻松迁移及接入。 数据规模无上限 凭借云存储能力,数据存储无上限,不再受限于本地容量。云端分布式存储保障数据可靠性。 通过Prometheus实例 for 多账号聚合实例将多个资源账号的指标数据汇聚到一个Prometheus实例,实现统一监控。 高性能 相
按创建时间、CPU使用率、集群名称等设置搜索条件,查看需要监控的集群。 单击集群名称,进入集群监控的详情页面。 在左侧导航栏可以按照健康中心、监控中心、日志中心、告警中心实现集群的云原生观测。(当前仅非洲-约翰内斯堡区域不开放。) 健康中心 集群健康诊断基于容器运维专家经验对集群健康状况进行全面检查,能够及时发
组件列表中对组件名称、状态、所属应用、部署方式、应用发现规则等参数进行展示。 为了方便您查看组件列表,您可以单击右上角图标对组件列表进行过滤显示,实现隐藏系统组件。 可以在组件列表上方设置过滤条件,实现组件列表过滤显示。 您可根据需要选择是否对组件执行如下操作: 添加别名 当组件名称比较复杂,不便于识别时,您可为该组件增加一个便于识别的别名。
索条件,实现进程过滤显示。 单击右上角的,可获取到设置的时间范围内进程的最新信息。 在CCE主机的“Pod实例”页签下,可查看实例状态、节点IP等信息。 单击实例名称,可逐层下钻查看该实例的容器、进程的详细信息。 在实例列表右上角的搜索框可按实例名称等设置搜索条件,实现实例过滤显示。
可观测性数据源。 全栈一体化监控 覆盖用户端、服务端及云产品所有监控数据,提供从数据发现、数据展示到数据异常告警的全方位、可视化监控服务,实现从上到下、从前端到后端的全栈一体化监控。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角下钻分析指标、日志、告警数据,直击异常。
设置为“全部企业项目”,请从下拉列表中选择。 图1 查看云服务信息 在云服务实例列表右上角可设置筛选条件或按实例名称、ID等设置搜索条件,实现云服务实例过滤显示。 单击右上角的,可实时获取到该云服务全部实例的最新信息。 单击任一实例名称,在对应实例页签中监控云服务实例各指标的数据曲线。
在左侧导航栏中选择“主机监控”,查看主机列表。 为了方便您查看主机列表,您可以: 单击右上角图标对主机列表进行过滤显示,实现隐藏控制节点。 可以在主机列表上方设置过滤条件,实现主机列表过滤显示。 您可根据需要选择是否对主机执行如下操作: 添加别名 当主机名称过于复杂不便于识别时,您可根据需要给主机添加一个便于识别的别名。
理完成后再发送通知,避免产生告警风暴。 告警降噪功能分为分组、去重、抑制、静默四部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 图1 告警降噪流程图 分组、抑制、静默需手动创建规则,创建方式见下方文档说明。 此模块只作用于消息通知
关指标,详情请参考配置应用发现规则。 监控应用 在左侧导航栏中选择“监控 > 应用监控”,查看应用列表。 可以在应用列表上方设置过滤条件,实现应用列表过滤显示。 单击应用名称,在“应用详情”页面,以应用维度对组件进行批量管理与监控。 您还可查看当前应用包含的组件列表、主机列表和告警分析。
授权项:自定义策略中支持的Action,在自定义策略中的Action中写入授权项,可以实现授权项对应的权限功能。 依赖的授权项:部分Action存在对其他Action的依赖,需要将依赖的Action同时写入授权项,才能实现对应的权限功能。 IAM项目(Project)/企业项目(Enterprise
技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
或“其他:用户自定义接入主机”。 升级ICAgent。如果在步骤2中下拉列表框中选择的是“集群:xxx”,则单击“升级ICAgent”。可实现整个集群的升级操作,即在ICAgent列表下的所有主机一次性完成升级。如果在步骤2中下拉列表框中选择的是“其他:用户自定义接入主机”,则先选择主机后单击“升级ICAgent”。
或“其他:用户自定义接入主机”。 升级ICAgent。如果在步骤2中下拉列表框中选择的是“集群:xxx”,则单击“升级ICAgent”。可实现整个集群的升级操作,即在ICAgent列表下的所有主机一次性完成升级。如果在步骤2中下拉列表框中选择的是“其他:用户自定义接入主机”,则先选择主机后单击“升级ICAgent”。
登录APM控制台。 在左侧导航栏选择“Web监控 > 自定义上报”。 自定义上报 会话追踪 APM支持会话追踪功能,此功能根据用户名或者用户ID,实现全链路追踪。复现用户访问时的行为轨迹,以便于定位问题。会话追踪包括:访问追踪、性能追踪、API追踪、JS错误追踪、行为追踪以及自定义追踪。
单击任一工作负载页签,即可在下方列表区域查看该工作负载的名称、状态、集群、命名空间等信息。 在工作负载列表上方可按集群、命名空间、实例名称等设置搜索条件,实现工作负载过滤显示。 拥有AOM FullAccess或者AOM ReadOnlyAccess权限的IAM用户,查询命名空间时需要登录云容器引擎
使用Remote Read地址和Remote Write地址,将自建Prometheus的监控数据存储到AOM的Prometheus实例中,实现远程存储。 预聚合 通过配置预聚合规则将计算过程提前到写入端,可减少查询端资源占用,尤其在大规模集群和复杂业务场景下可以有效的降低Prom
_code,将原生Prometheus的指标通过remote write上报到AOM服务端,参见将Prometheus的数据上报到AOM,实现时序数据的长期存储;也可以通过access_code作为认证凭据来查询AOM中的数据,参见通过grafana查看AOM中的指标数据,AOM