检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,
cce_gpu_memory_clock gpu显存频率 cce_gpu_graphics_clock gpu图形处理器频率 cce_gpu_video_clock gpu视频处理器频率 cce_gpu_temperature gpu温度 cce_gpu_power_usage gpu功率
日志接入 可以将应用资源管理中主机待采集日志的路径配置到日志流中,ICAgent将按照日志采集规则采集日志,并将多条日志进行打包,以日志流为单位发往AOM,您可以在AOM控制台实时查看日志。 前提条件 已为应用添加组件和环境,详情请参见添加节点和添加环境。 已创建需要映射的日志组
规则。 查看告警 在已设的监控周期内,当某个资源或资源的指标数据满足告警条件时,产生对应的告警。 可在左侧导航栏中选择“告警管理 > 告警列表”,在“告警”页签下查看该告警,具体请参见查看告警。 查看事件 在已设的监控周期内,当某个资源没有指标数据上报时,会产生一条数据不足的事件。
resource_provider:事件对应云服务名称。类型为String; resource_type:事件对应资源类型。类型为String; resource_id:事件对应资源信息。类型为String。 annotations 否 Map<String,Object> 事件或者告警附加字段,可以为空。
设置阈值规则的详细信息。 设置“规则类型”为“阈值规则”。 选择监控对象。通过以下两种方式选择: 选择资源对象:单击“选择资源对象”,通过“按资源添加”或“按指标维度添加”方式在资源树上选择待监控的资源,设置完成,单击“确定”。 监控对象最多可添加100条指标数据。 选择监控对象时,如果开启
也可以通过“创建主题”的方式选择。通过选择“主题”的方式配置通知人,需要先通过“创建主题”创建一个新主题,并为这个主题添加订阅,之后即可通知。 执行失败通知 任务执行失败时,发送通知给相关人,系统默认开关关闭。 通知人配置:在下拉列表中选择“通知人”,可以选择一个或者多个。 也可以通过“创建主题”的
创建仪表盘(新版) 通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形式来展示资源的指标数据或日志数据,例如,折线图、数字图等,帮助用户全面、深入地掌握监控数据。 仪表盘(新版)功能当前仅在华东-上海一区域受限开放,如有需求可以通过提交工单,为您开放此功能。 注意事项 系
建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 通过告警降噪清除告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 通
、指标类型等信息。 还可以通过指标类型或资源类型过滤显示指标,也可通过输入指标名称中的关键字进行模糊搜索。 表2 指标参数说明 参数 说明 指标名 指标的名称。 指标类型 指标的类型,包含基础指标和自定义指标。 资源类型 资源的类型,资源类型为接入的云服务类型。 查看ECS类型Prometheus实例的指标
系统会在每个计费周期后的一段时间对按需计费资源进行扣费。当您的账户被扣为负值时,我们将通过邮件、短信和站内信的方式通知到华为云账号的创建者。 欠费后影响 当您的账号因按需AOM资源自动扣费导致欠费后,账号将变成欠费状态。欠费后,按需资源不会立即停止服务,资源进入宽限期。您需支付按需资源在宽限期内产生的费用,相关费用可在“管理控制台
ICAgent安装成功后,无法在界面上获取到ICAgent状态 问题描述 ICAgent安装成功后,无法在界面上获取到ICAgent状态。 原因分析 用户侧使用虚拟网卡,想要获取到ICAgent状态信息需要修改下相关脚本规避。 解决办法 以root用户登录已安装ICAgent的CCE集群的某个主机服务器。
别 、资源类型、事件源等条件进行过滤,默认按照事件级别过滤。 表1 搜索条件说明 搜索条件 搜索条件说明 设置样例 事件级别 支持选择如下事件级别进行搜索: 紧急 重要 次要 提示 事件级别:重要,即可查询出指定时间范围内事件级别为“重要”的事件。 资源类型 支持选择资源类型别进行搜索。
义时间范围,查看已设时间范围内资源信息。 单击右上角的,可实时获取到资源的最新信息。 单击右上角的,可全屏展示资源信息。 在“相关资源”页签下,展示该节点所在的容器组。 在左侧导航栏选择“洞察 > 工作负载 ”,可查看该集群的所有工作负载状态和资源使用情况。 在工作负载列表上方,
的操作事件,便于日后的查询、审计和回溯。 资源类型为pe的事件,其实际执行服务为AOM,但操作入口位于云容器引擎(CCE)或应用管理与运维平台(ServiceStage)。 表1 云审计服务支持的AOM操作列表 功能类别 操作名称 资源类型 事件名称 全局配置 添加AccessCode
如果ICAgent状态为“离线”或其他状态,则请单击状态后的“详情”查看ICAgent安装失败的原因,可能是输入的AK/SK错误或ECS委托设置错误等原因导致,请获取正确的AK/SK或正确设置ECS委托后重新安装。如果还未安装成功,则请提交工单处理,操作详见如何提交工单。 在AOM界面监控ECS。 ICAgent安
ercentage 请求失败率超阈值的驱逐次数 主机因请求失败率达到失败率阈值而被驱逐的次数。 ≥0 次 envoy_cluster_ejections_detected_local_origin_failure_percentage 本地主动请求检测失败率超阈值的驱逐次数 主机
“promql”:PromQL “resource”:(日落)资源类型 枚举值: all_metric promql resource no_data_conditions 否 Array of NoDataCondition objects 无数据处理。 alarm_tags 是 Array of
只能由大小写字母、数字、下划线组成,且不能以下划线开头和结尾,最多不能超过100个字符。 企业项目 所属的企业项目。 如果在全局页面设置为“ALL”,此处请从下拉列表中选择企业项目。 如果在全局页面已选择企业项目,则此处灰化不可选。 描述 抑制规则的描述。最多不能超过1024个字符。 抑制规则
只能由大小写字母、数字、下划线组成,且不能以下划线开头和结尾,最多不能超过100个字符。 企业项目 所属的企业项目。 如果在全局页面设置为“ALL”,此处请从下拉列表中选择企业项目。 如果在全局页面已选择企业项目,则此处灰化不可选。 描述 静默规则的描述。最多不能超过1024个字符。 静默规则