检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
对应容器名的标准输出日志。用户在pod的yaml中spec:template:metadata:annotations:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout: '["container_name0", "container_name1"]'
账号接入 AOM支持在Prometheus实例的“接入账号”中将同一组织下多个成员账号接入AOM后,实现对同一组织下多个成员账号的云服务指标进行监控。通过数据多写功能,可以实现跨VPC的访问,而不必暴露服务端相关的网络信息。 当前仅多账号聚合实例类型Prometheus实例支持。
在整个时间间隔内,有20%的SM的Tensor Core以100%的利用率运行。 在整个时间间隔内,有100%的SM的Tensor Core以20%的利用率运行。 在整个时间间隔的1/5时间内,有100%的SM上的Tensor Core以100%利用率运行。 其他组合模式。 0~1.0 占比(Fraction)
开源监控系统接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,通过创建Prometheus 通用实例实现开源监控系统接入AOM。 应用场景 Prometheus 通用实例类型,适合已经自建了Prometheus服务器,但需要通过远端存储(Remote Write
日志搜索。 编辑yaml:通过在工作负载的yaml中spec:template:metadata:annotations:下增加以下字段来实现 kubernetes.AOM.log.relabel: '{"key1":"value1", "key2":"value2"} 自定义标签限制如下:
接入AOM 接入AOM总览 管理采集器底座UniAgent 业务层接入AOM 应用层接入AOM 中间件及自定义插件接入AOM 运行环境接入AOM 云服务接入AOM 开源监控系统接入AOM 管理日志接入
管理CCE集群的ICAgent插件 AOM支持对您已购买的CCE(云容器引擎)集群下的主机批量执行ICAgent插件安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。
管理CCE集群的ICAgent插件 AOM支持对您已购买的CCE(云容器引擎)集群下的主机批量执行ICAgent插件安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。
供告警、监控、prometheus监控、日志、Prometheus实例、配置管理、应用资源管理、自动化运维的开放接口,帮助您快速、低成本地实现应用运维。AOM 2.0相关接口当前在华为云政务平台-乌兰察布、华北-乌兰察布-汽车一、中东-利雅得、华北-北京一、华北-北京四、华北-北
接入AOM(新版) 接入AOM总览 管理采集器底座UniAgent 业务层接入AOM 组件层接入AOM 中间件接入AOM 运行环境接入AOM 云服务接入AOM API开源协议及其他组件接入AOM 管理指标接入和日志接入
用于区分一个组件的不同环境或者一个组件的多个部署区域。一个组件或者程序,由于部署不同的配置参数,形成多个环境。每个环境都有region属性,可以通过region信息实现环境的过滤,也可以在创建环境时打上一个或多个标签,通过标签进行环境过滤。例如按照环境类型区分包括:正式、测试。 环境标签 为环境设置的一个
然后在下方列表区域单击“关联资源”。 云容器引擎CCE不支持关联资源。 从资源列表中选择合适的资源实例。 在资源列表上方设置过滤条件,可实现资源列表过滤显示。 单击右上角的,可实时获取到所有资源实例的最新信息。 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义其展示/隐藏。
pt/oss/servicemgr/目录。稍等片刻后,返回“Agent管理”界面,查看ECS的ICAgent状态是否为“运行”。 如果ICAgent状态为“运行”,则表示ICAgent安装成功。 如果ICAgent状态为“离线”或其他状态,则请单击状态后的“详情”查看ICAgen
gent会加密存储您的AKSK,有效保护敏感信息。 容器监控 在CCE容器监控场景下,AOM的采集器(ICAgent)必须以特权容器的方式运行,请合理的评估特权容器的安全风险,谨慎识别您的容器业务场景。如:节点对外提供的业务属于逻辑多租的共享容器方式,建议采用开源Promethe
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
le 期望运行DaemonSet且已经至少运行一个Pod的节点数 kube_daemonset_status_number_misscheduled 期望之外运行DaemonSet的节点数 kube_daemonset_status_number_ready 期望运行DaemonSet且Pod已经就绪的节点数
用及云资源,采集各项指标、日志及事件等数据分析应用健康状态,提供告警及数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。 了解服务 立即使用 成长地图 由浅入深,带您玩转AOM 01 了解 AOM是云上应用的一站式立体化运维管理平台。 产品介绍 什么是AOM
关闭状态。 CPU 开启或关闭“CPU”开关: 开启:采集应用运行过程中CPU火焰图信息。 关闭:不采集应用运行过程中CPU火焰图信息。开关默认为关闭,即开关置灰。 内存 开启或关闭“内存”开关: 开启:采集应用运行过程中堆内存火焰图信息。 Live Object Memory:
使用Prometheus监控CCE集群指标 配置多账号聚合实现指标统一监控 配置CCE集群监控采集指标规则 配置预聚合规则提升指标查询效率 配置数据多写实现监控指标转储到自建Prometheus 配置指标存储时长 通过仪表盘监控Prometheus实例指标数据 配置Remote Read地址实现自建Prometheus读取AOM的Prometheus数据
ent会加密存储您的AK/SK,有效保护敏感信息。 容器监控 在CCE容器监控场景下,AOM的采集器(ICAgent)必须以特权容器的方式运行,请合理的评估特权容器的安全风险,谨慎识别您的容器业务场景。如:节点对外提供的业务属于逻辑多租的共享容器方式,建议采用开源Promethe