检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
当满足以下条件时,您需要按照该方式安装: 您有多个服务器需要安装ICAgent,其中一个服务器已经通过首次安装方式装好了ICAgent,且所有服务器在同一VPC下,可以采用该安装方式。当所有服务器不在同一VPC下,需要给所有服务器绑定EIP后再采用该安装方式。 首次安装 您申请服务器后,首次安装ICAgent,需执行如下操作:
Prometheus监控概述 管理Prometheus实例 管理Prometheus实例指标数据 使用Prometheus监控CCE集群指标 配置多账号聚合实现指标统一监控 配置CCE集群监控采集指标规则 配置预聚合规则提升指标查询效率 配置数据多写实现监控指标转储到自建Prometheus 配置指标存储时长
护。 采集器部署 在弹性云服务器 ECS上手动部署ICAgent过程中,安装命令中会使用到您的AK/SK作为输入参数,安装前请您关闭系统的历史记录收集,以免泄露隐私。安装后ICAgent会加密存储您的AK/SK,有效保护敏感信息。 容器监控 在CCE容器监控场景下,AOM的采集器
护。 采集器部署 在弹性云服务器 ECS上手动部署ICAgent过程中,安装命令中会使用到您的AK/SK作为输入参数,安装前请您关闭系统的历史记录收集,以免泄露隐私。安装后ICAgent会加密存储您的AKSK,有效保护敏感信息。 容器监控 在CCE容器监控场景下,AOM的采集器(
事件 您最多可查询最近31天的事件。 - 应用发现规则 应用发现规则最多可创建100个。 服务使用限制 在使用AOM时,当AMS-Access服务出现断电、或者异常重启的时候,部分主机、组件、容器等资源会出现一个采集周期的指标数据断点,该数据断点对于用户来讲监控页面上能看到一个断点,
通过系统预置的仪表盘模板,用户可以快速监控云服务类型和default类型Prometheus实例的指标数据,及时定位并发现资源数据存在的问题,提升运维效率。 前提条件 服务已接入云服务类型Prometheus监控并接入云服务,具体请参见Prometheus实例 for 云服务。 约束与限制 目前仅d
] } 示例3:多个授权项策略 一个自定义策略中可以包含多个授权项,且除了可以包含本服务的授权项外,还可以包含其他服务的授权项,可以包含的其他服务必须跟本服务同属性,即都是项目级服务。多个授权语句策略描述如下: { "Version": "1.1",
] } 示例3:多个授权项策略 一个自定义策略中可以包含多个授权项,且除了可以包含本服务的授权项外,还可以包含其他服务的授权项,可以包含的其他服务必须跟本服务同属性,即都是项目级服务。多个授权语句策略描述如下: { "Version": "1.1",
接入Prometheus后,为什么会产生额外费用? CCE容器场景 通常情况下,用户购买CCE集群,部署工作负载之后,默认会采集cluster、Pod、Container、Node等基础指标-容器指标,基础指标的上报不产生费用。 产生计费的可能原因是: Prometheus实例内
事件 您最多可查询最近31天的事件。 - 应用发现规则 应用发现规则最多可创建100个。 服务使用限制 在使用AOM时,当AMS-Access服务出现断电、或者异常重启的时候,部分主机、组件、容器等资源会出现一个采集周期的指标数据断点,该数据断点对于用户来讲监控页面上能看到一个断点,
Prometheus实例 for CCE CCE 提供与容器服务原生的集成能力、容器指标的监控能力。 默认开启以下服务发现能力:Kubernetes SD、 ServiceMonitor、PodMonitor的自定义发现。 适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。
基础设施监控 通过helm部署pod后,AOM无法查找到工作负载
单击卡片右上角的并选择“下架”,下架后服务场景页面将不展示该卡片。下架服务卡片后,原子服务场景关联的原子任务不能再次被执行,待该原子场景被重新上架后,关联的原子任务恢复执行功能。 服务下架时,需确认服务是否被定时运维场景引用,如果已被引用,需先删除被引用场景,才能下架服务,具体见警告提示框的“引用详情”。
配置日志采集路径 配置容器服务日志采集路径 配置虚机日志采集路径 父主题: 资源接入AOM
在右侧“业务层”类型中单击需要接入的卡片,参考下表执行相关接入操作。 表1 业务层接入AOM 卡片 相关操作 基于ELB日志 在“日志指标规则”页面接入相关的ELB日志指标,具体操作请参见配置ELB日志指标接入AOM。 基于APM事务 在“接入应用”页面接入相关的APM事务指标,具体操作请参见快速接入Agent。
权限隔离。 将AOM资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用AOM服务的其它功能。 本章节为您介绍对用户授权的方法,操作流程如图1所示。
401 Unauthorized 在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 403 Forbidden 请求被拒绝访问。返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。
2019-11-30 支持云服务监控功能:展示华为云各服务实例的历史性能数据曲线,了解云服务实例运行状况。 2019-11-13 日志采集规则修改:指定日志采集文件名时不受日志文件扩展名(.log、.trace和.out)限制;被采集日志文件必须为文本文件。 2019-8-30 容器指标增加对“
资源监控 资源监控使用说明 应用监控 组件监控 主机监控 容器监控 指标浏览 云服务监控
入门实践 当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。