检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
件、节点日志)。详情请参见日志中心。 告警中心 告警中心集成应用运维管理服务AOM2.0的告警功能,提供容器告警一键开启能力,覆盖集群和容器常见故障场景。详情请参见告警中心。 在左侧的导航栏,可以按集群、告警管理、仪表盘三个维度全面监控集群的运行状态,具体请参见6。(当前仅非洲-约翰内斯堡区域开放。)
自定义指标 无限制。 上报自定义指标 单次请求数据最大不能超过40KB,上报指标所带时间戳不能超前于标准UTC时间10分钟,不接收乱序指标,即有新指标上报后,旧指标上报将会失败。 应用指标 JOB指标 每个主机的容器个数超过1000个时,ICAgent将停止采集该主机应用指标,并发送“
表示该主机正在安装UniAgent。安装UniAgent预计需要1分钟左右,请耐心等待。 安装失败 表示主机安装UniAgent失败,请请卸载UniAgent后,并重新安装。如果还未安装成功,请联系技术支持。 未安装 表示主机未安装UniAgent。对于成功安装过UniAgent的主机,在卸载UniAgen
(ICAgent)”卡片,可查看支持接入的CCE集群指标。上报到AOM的CCE集群指标,详细说明请参见基础指标-虚机指标。 如需通过Prometheus采集CCE集群指标数据上报到AOM,具体操作请参见使用Prometheus监控CCE集群指标。 云容器实例 CCI 云容器实例CCI服务
解决方法 若ICAgent未安装成功,请重新安装ICAgent。 若ICAgent安装成功,但是无法监控到主机,通常有几种原因: 配置错误:Region名错误,或PODLB地址错误。 数据采集失败:调openstack接口失败,或采集的hostid为空。 请查看ICAgent的日志并检查配置,根据日志报错判断原因。
表示该主机正在安装UniAgent。安装UniAgent预计需要1分钟左右,请耐心等待。 安装失败 表示主机安装UniAgent失败,请请卸载UniAgent后,并重新安装。如果还未安装成功,请联系技术支持。 未安装 表示主机未安装UniAgent。对于成功安装过UniAgent的主机,在卸载UniAgen
4031012 Failed to verify the project ID. 请检查对应的参数是否符合要求。 SVCSTG.PE.5001205 Failed to delete records. 请联系技术支持工程师解决。 父主题: 弹性伸缩(即将下线)
表1 Agent状态说明 状态 说明 正常 该Agent运行正常。 离线 由于网络问题导致该Agent功能异常,请检查并恢复网络。 停止 该Agent被手动停止或全局停止,请联系技术人员处理。 父主题: 应用监控
告警行动规则与SMN主题、消息模板关联的类型,请从下拉列表中选择。当前只支持“通知”类型。 通知 主题 SMN主题,请从下拉列表中选择。 若没有合适的主题,请单击主题选择栏下方“创建主题”,在SMN界面创建。 - 消息模板 通知消息的模板,请从下列列表中选择。 若没有合适的消息模板,
ICAgent只采集*.log、*.trace和*.out类型的日志文件,请确保日志文件后缀为.log、.trace或.out。例如,/opt/yilu/work/xig/debug_cpu.log。 请确保配置的路径是日志目录或文件的绝对路径,且该路径是实际存在的。例如,/op
输入文件包分发到ECS实例上的实际存放路径。 - 描述 文件包的描述信息,最多可输入128个字符。 文件来源 OBS区域 OBS桶所在的区域,请从下拉列表中选择。 OBS桶 文件包所在的OBS桶,请从下拉列表中选择。 OBS对象路径 输入OBS服务对象的路径。获取OBS对象之前,您需要在“设置 > 访问凭证”界面设置访问凭证。
自定义指标 无限制。 上报自定义指标 单次请求数据最大不能超过40KB,上报指标所带时间戳不能超前于标准UTC时间10分钟,不接收乱序指标,即有新指标上报后,旧指标上报将会失败。 应用指标 JOB指标 每个主机的容器个数超过1000个时,ICAgent将停止采集该主机应用指标,并发送“
消息模板中通过$event.metadata.key1变量获取告警标签信息,具体请参见消息模板变量说明。 如您的组织已经设定AOM服务的相关标签策略,则需按照标签策略规则添加告警标签。标签如果不符合标签策略的规则,则可能会导致添加标签失败,请联系组织管理员了解标签策略详情。 告警标注说明 告警标注主要
Forbidden 请更换有权限的账号。 SVCSTG.INV.4000115 Invalid request parameter. 请检查参数。 SVCSTG.INV.5000002 The Elasticsearch execution is abnormal. 请联系技术支持工程师解决。
如果在创建告警规则时设置了告警标签,触发的告警会自动添加该标签为告警属性。 消息模板中通过$event.metadata.key1变量获取告警标签信息,具体请参见消息模板变量说明。 告警标注特征 告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标注为key:value键值对格式,支持用户自定义。key
单击模板上的“编辑”可将AOM系统监控数据(如告警数据、Prometheus监控数据等),呈现在业务指标监控大屏页面上,详情请参见监控AOM系统指标数据。 根据自身实际业务的需求,您还可以自定义大屏页面呈现的内容,详情请参见自定义业务指标监控大屏。 父主题: 仪表盘监控
给用户组授权之前,请您了解用户组可以添加的AOM权限,并结合实际需求进行选择,AOM支持的系统权限,请参见AOM系统权限。若您需要对除AOM之外的其他服务授权,IAM支持服务的所有系统权限请参见系统权限。 示例流程 图1 给用户授权AOM权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予AOM只读权限“AOM
从下拉列表选择需要监控的Prometheus实例。 通过“全量指标”或“按普罗语句添加”方式选择一个或多个关注的指标。监控条件设置的详细说明请参见添加指标图表详情填写说明。 通过“全量指标”方式选择指标 图1 通过“全量指标”方式选择指标 选择某个关注的指标后,可根据条件属性过滤显
在“监控视图”页签下,可视化展示该工作负载的资源使用情况。 在“告警”页签下,可查看该工作负载的告警详情,详情请参见查看AOM告警或事件。 在“事件”页签下,可查看该工作负载的事件详情,详情请参见查看AOM告警或事件。 父主题: 基础设施监控
给用户组授权之前,请您了解用户组可以添加的AOM权限,并结合实际需求进行选择,AOM支持的系统权限,请参见AOM系统权限。若您需要对除AOM之外的其他服务授权,IAM支持服务的所有系统权限请参见系统权限。 示例流程 图1 给用户授权AOM权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予AOM只读权限“AOM