检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
对应容器名的标准输出日志。用户在pod的yaml中spec:template:metadata:annotations:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout: '["container_name0", "container_name1"]'
用于区分一个组件的不同环境或者一个组件的多个部署区域。一个组件或者程序,由于部署不同的配置参数,形成多个环境。每个环境都有region属性,可以通过region信息实现环境的过滤,也可以在创建环境时打上一个或多个标签,通过标签进行环境过滤。例如按照环境类型区分包括:正式、测试。 环境标签 为环境设置的一个
数据多写 通过数据多写功能,可以实现跨VPC的访问,而不必暴露服务端相关的网络信息,以更加安全、可靠的方式将监控数据上报到自建Prometheus中。 前提条件 服务已接入ECS类型Prometheus监控,具体请参见Prometheus实例 for ECS。 服务已接入云服务类
rometheus实例的Remote Write地址。将原生Prometheus的指标通过Remote Write上报到AOM服务端,即可实现时序数据的长期存储。 如果已经部署并正在使用开源Prometheus,可直接进行4。 前提条件 已购买弹性云服务器ECS。 服务已接入可观测Prometheus
日志搜索。 编辑yaml:通过在工作负载的yaml中spec:template:metadata:annotations:下增加以下字段来实现 kubernetes.AOM.log.relabel: '{"key1":"value1", "key2":"value2"} 自定义标签限制如下:
供告警、监控、prometheus监控、日志、Prometheus实例、配置管理、应用资源管理、自动化运维的开放接口,帮助您快速、低成本地实现应用运维。AOM 2.0相关接口当前在华为云政务平台-乌兰察布、华北-乌兰察布-汽车一、中东-利雅得、华北-北京一、华北-北京四、华北-北
CCE接入 CCE(云容器引擎)接入展示您已购买的CCE集群,可以对该集群下的主机批量执行ICAgent安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群。 查看集群 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。
然后在下方列表区域单击“关联资源”。 云容器引擎CCE不支持关联资源。 从资源列表中选择合适的资源实例。 在资源列表上方设置过滤条件,可实现资源列表过滤显示。 单击右上角的,可实时获取到所有资源实例的最新信息。 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义其展示/隐藏。
2.0控制台。 在左侧导航栏中选择“基础设施监控 > 进程监控”,进入应用监控界面,查看应用列表。 在应用列表上方搜索框中设置过滤条件,可以实现应用列表过滤显示。 在页面右上角单击,通过选中/取消选中各展示项后的复选框,自定义列表项的展示/隐藏。 在页面右上角单击,根据需要在下拉列表中设置应用信息的统计条件。
本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重复繁杂的应用变更操作中解脱出来,提升运维操作的质量和效率,帮助企业运维转型和运维价值提升。
理完成后再发送通知,避免产生告警风暴。 告警降噪功能分为分组、去重、抑制、静默四部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 图1 告警降噪流程图 分组、抑制、静默需手动创建规则,创建方式见下方文档说明。 此模块只作用于消息通知
统。AOM并非传统监控,它通过应用的角度看业务,满足企业对业务的高效和快速迭代的需求,可帮助企业实现 IT 对业务的有效支撑,保护、优化IT资产投资,使企业更好的达到其战略目标并实现IT资产价值的最大化。通过云审计服务,您可以记录与AOM服务相关的操作事件,便于日后的查询、审计和回溯。
图1 查看告警规则 表1 告警规则相关操作 操作 说明 过滤显示告警规则 在规则列表的列表项支持按规则名称、类型、状态等设置筛选条件,实现告警规则过滤显示。 刷新告警规则 在规则列表右上角单击,可实时获取所有告警规则的最新信息。 自定义列表项 在规则列表右上角单击,通过选中/
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
义上报等数据,帮助用户全面掌握前端应用的运行情况。 App监控 APM Agent会周期性采集一些App监控的性能指标数据,用来衡量Android端、iOS端的总体健康状况。可以采集崩溃、卡顿、错误、启动性能、网络请求、终端设备以及自定义上报等数据,帮助用户全面掌握App应用的运行情况。
静态文件配置和动态发现机制发现监控对象,实现轻松迁移及接入。 数据规模无上限 凭借云存储能力,数据存储无上限,不再受限于本地容量。云端分布式存储保障数据可靠性。 通过Prometheus实例 for 多账号聚合实例将多个资源账号的指标数据汇聚到一个Prometheus实例,实现统一监控。 高性能 相
AOM的日志绕接能力是使用copytruncate方式实现的,如果选择了设置,请务必保证您写日志文件的方式是append(追加模式),否则可能出现文件空洞问题。 当前主流的日志组件例如Log4j、Logback等均已经具备日志文件的绕接能力,如果您的日志文件已经实现了绕接能力,则无需设置。否则可能出现冲突。
授权项:自定义策略中支持的Action,在自定义策略中的Action中写入授权项,可以实现授权项对应的权限功能。 依赖的授权项:部分Action存在对其他Action的依赖,需要将依赖的Action同时写入授权项,才能实现对应的权限功能。 IAM项目(Project)/企业项目(Enterprise
Notification,简称SMN)可以依据您的需求主动推送通知消息,最终您可以通过短信、电子邮件、应用等方式接收通知信息。您也可以在应用之间通过消息通知服务实现应用的功能集成,降低系统的复杂性。 AOM使用SMN提供的消息发送机制,当您因不在现场而无法通过AOM查询阈值规则状态的变更信息时,能及时
Notification,简称SMN)可以依据您的需求主动推送通知消息,最终您可以通过短信、电子邮件、应用等方式接收通知信息。您也可以在应用之间通过消息通知服务实现应用的功能集成,降低系统的复杂性。 AOM使用SMN提供的消息发送机制,当您因不在现场而无法通过AOM查询阈值规则状态的变更信息时,能及时