检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
CCE集群的指标管理配置完成后,您还可以执行表1中的操作。 表1 相关操作 操作 说明 查看指标管理 在列表中,可查看名称、标签、命名空间、配置方式等信息,并支持按集群名称、命名空间或配置方式筛选查看。 单击“操作”列的,在弹出的对话框中查看ServiceMonitor或PodMonitor采集规则详情。
不支持基于CMDB模型,对指标数据分层监控。 支持 容器洞察 从工作负载和集群2个维度监控CCE的资源使用、状态和告警等信息,以便快速响应,保证工作负载顺畅运行。 支持 支持 指标浏览 实时监控日志数据和各资源的指标数据及趋势,还可对关注的指标进行创建告警规则等操作,以便实时查看业务及分析数据关联分析。
映射创建后,即可通过LTS查看和分析AOM日志。 图1 未创建映射 创建日志流A并创建接入规则后,即已创建AOM至LTS的映射,最新的AOM日志将上报至日志流A,AOM可以查看映射前后所有的日志数据,日志流A不会复制或移动原AOM日志流中的历史数据,如图2所示。 图2 已创建映射
映射创建后,即可通过LTS查看和分析AOM日志。 图1 未创建映射 创建日志流A并创建接入规则后,即已创建AOM至LTS的映射,最新的AOM日志将上报至日志流A,AOM可以查看映射前后所有的日志数据,日志流A不会复制或移动原AOM日志流中的历史数据,如图2所示。 图2 已创建映射
区域生效。 通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 告警规则分为阈值规则和事件类告警规则两种。通常情况下,通过阈值规则,实时监控
创建事件类告警规则 通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警
手动升级 引导用户如何将AOM 1.0 的数据迁移至AOM 2.0 ,目前仅支持日志升级、采集器升级和告警规则升级功能。 功能介绍 日志升级 日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。
费。 CCI实例监控 按需计费 秒级监控指标数量 按需计费 自定义指标 按需计费 查询指标数据API调用 按需计费 免费 事件和告警总条数 按需计费 免费 指标存储量 7天内免费 15天内免费 数据转储量 免费 按需计费
手动升级 引导用户如何将AOM 1.0 的数据迁移至AOM 2.0 ,目前仅支持日志升级、采集器升级和告警规则升级功能。 功能介绍 日志升级 日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。
的指标。 更多统计规则操作 创建完统计规则后,您还可以执行更多统计规则操作中的操作。 表1 相关操作 操作 说明 查看统计规则 在“规则名称”列单击统计规则名称,查看统计规则的详细信息。 修改统计规则 单击“操作”列的“编辑”。 删除统计规则 删除一个统计规则:单击“操作”列的“删除”。
场景服务提供准确、及时、一致的资源配置数据。 采集管理:统一管理插件,并为AOM提供指令下发功能,如脚本下发和执行。 开放:支持原生PromQL数据上报,也可通过API等方式上报数据,并也可通过grafana查看数据,通过kafka转储数据。 AOM产品介绍 AOM快速入门 AOM成长地图
在工作负载列表中“无状态负载”页签下,单击3.b创建的无状态工作负载的名称,在实例列表中单击操作列下的“更多 > 日志”,可以查看到Exporter成功启动并暴露访问地址。 图1 查看日志 验证。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令: curl http://{集群IP}:9121/metrics
响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形式来展示资源数据,例如,数字图、TopN图表等,进而全面、深入地掌握监控数据。 例如,可将重要资源的关键指标添加到仪表盘中,从而实时地进行监控。还可将不同资源的同一指标展示到同一个图形界面上进行对比。另外,对于例行运维需要查看的指标,可添加到仪表盘中,以便再次
监控:包括所有监控相关接口对应的授权项,例如查询指标接口。 Prometheus监控:包括所有Prometheus监控相关接口对应的授权项,例如区间数据查询接口。 日志:包括所有日志相关接口对应的授权项,例如查询日志接口。 Prometheus实例:包括所有Prometheus实例相关
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
可设置为31天。 设置搜索条件后,单击,查看在已设时间范围内满足搜索条件的事件。 您可参考表1执行如下操作: 表1 操作说明 操作 方法 说明 查看事件统计数据 单击“事件分布图”,可通过柱状图查看在指定时间范围内和搜索条件下事件的统计数据。 - 父主题: 告警管理
容器组名称查看当前容器相关的节点、工作负载、容器组信息。 按告警管理维度查看当前集群的运行状态。 在左侧导航栏选择“告警管理 > 告警列表”,可查看该集群的告警详情,详情请参见查看告警。 在左侧导航栏选择“告警管理 > 事件列表”,查看该集群的事件详情,详情请参见查看事件。 在左侧导航栏选择“告警管理
实例等维度快速过滤。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角分析关联指标和告警数据,直击异常。 生态开放 开放了运营、运维数据查询接口和采集标准,支持自主开发。
全部实例”的“URL监控”信息。 在接口调用页签选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义