检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择NPU节点,添加标签“accelerator/huawei-npu”,标签值可为空。 图1 添加npu插件标签 单击“确定”完成npu节点标签添加。 父主题: NPU调度
Lt:标签的值小于某个值(字符串比较) 标签值 请填写标签值。 命名空间 仅支持在工作负载亲和/工作负载反亲和调度策略中使用。 指定调度策略生效的命名空间。 拓扑域 仅支持在工作负载亲和/工作负载反亲和调度策略中使用。 先圈定拓扑域(topologyKey)指定的范围,然后再选择策略定义的内容。 权重
卷时容器将固定调度至本地存储卷所在节点运行,需确保Pod与目标节点没有调度冲突。 存储类型:选择“CSI-Local”。 容量:创建PVC时指定的容量大小,此容量仅供参考,实际容量为本地目录所在盘的可用容量。 节点:指定普罗服务准备调度的节点,需确保普罗服务可调度到此节点。 节点
GPU卡--XGPU设备算力使用率 GPU卡--XGPU设备数量 GPU卡--调度策略 GPU卡--不健康的XGPU设备数量 容器显存分配量 容器算力使用率 容器显存使用量 容器显存使用率 父主题: 容器智能分析
关于插件的详细说明,请参考kube-prometheus-stack插件和云原生日志采集插件章节。 目前容器智能分析支持监控华为云集群、附着集群、本地集群、多云集群。在开启监控时,各个集群的参数配置存在差异,因此,本小节将分别介绍这五种集群的开启操作。 为华为云集群开启监控 为本地集群开启监控 为附着集群开启监控
登录UCS控制台,在左侧导航栏中选择“容器智能分析”,选择一个容器舰队。 单击“容器洞察 > 节点总览”页签查看节点总览。 页面简介 节点总览页面包含了同一舰队内已开启监控的所有集群下的节点信息,以及节点风险统计和资源占用情况。 表1 节点总览页面 词条 词条简介 节点概览 节点概况展示了节点
本地集群如何扩容容器智能分析插件的存储磁盘? 问题描述 当容器智能分析插件(kube-prometheus-stack)所依赖的PVC存储中的磁盘写满时,prometheus-server-0 Pod的日志标准输出会出现“no space left on device”报错,此时
查看集群情况 查看集群情况流程 在“容器洞察 > 集群总览”页面的集群统计列表中,单击集群名称跳转至单个集群的智能分析页面。本页面分为五个页签,分别为: “集群”页签:具体信息请参见查看集群详情。 “节点”页签:具体信息请参见查看集群内节点详情。 “工作负载”页签:具体信息请参见查看集群内工作负载详情。
流量分发概述 UCS提供的流量分发功能可基于访问位置和业务策略对全域流量进行最优化调度,支持跨云多集群服务接入和流量管理,实现智能流量分发调度,实时跨域、按需调配应用访问流量。 通过云解析服务DNS,用户的访问流量可根据运营商、地域等维度进行切分,对同一域名的访问请求进行不同的解
选择。 公网接入要求集群能够访问公网,请确保集群已符合此条件,否则会接入失败。 为集群开启监控 登录UCS控制台,在左侧导航栏中单击“容器智能分析”。 选择一个容器舰队或者未加入舰队的集群,并单击右上角“开启监控”按钮。 图1 选择舰队或未加入舰队的集群 选择一个多云集群。 单击“下一步:接入配置”,完成网络配置。
私网接入是通过云专线(DC)或虚拟专用网络(VPN)服务将第三方云网络与云上虚拟私有云(VPC)连通,并利用VPC终端节点通过内网与容器智能分析建立连接,具有高速、低时延、安全的优势。 图1 私网接入原理 因此,在开启之前,您需要准备满足一个云上虚拟私有云(VPC),并将第三方
网格使用时无法创建代理,istio组件调度失败,一直处于pending状态 解决方案 请检查节点的istiod的标签(istio=master)是否存在。 如果不存在请将istiod的标签istio=master加上。 可能原因 在CCE集群中把节点移除之后又再次纳管进去会重置节点,清除节点的标签。
私网接入是通过云专线(DC)或虚拟专用网络(VPN)服务将伙伴云网络与云上虚拟私有云(VPC)连通,并利用VPC终端节点通过内网与容器智能分析建立连接,具有高速、低时延、安全的优势。 图1 私网接入原理 因此,在开启之前,您需要准备满足一个云上虚拟私有云(VPC),并将伙伴云
容器洞察概述 容器洞察提供基于Kubernetes原生类型的容器监控能力,全面监控集群的健康状态和负荷程度。 支持集群、节点、工作负载的资源全景。 支持节点的资源占用、工作负载的资源消耗。 展示近一小时的CPU/内存指标。 父主题: 容器洞察
”、“不可用”、“安装失败”、“删除失败”和“未知”状态时,不允许修改集群监控配置。 操作步骤 登录UCS控制台,在左侧导航栏中选择“容器智能分析”。 选择一个容器舰队或者未加入舰队的集群。 图1 选择舰队或未加入舰队的集群 单击“容器洞察 > 集群总览”页签查看已开启监控的集群
、网络流入/流出速率、磁盘使用率等。 页面中容器组、Pod以及实例是指同一个概念。 功能入口 登录UCS控制台。 在左侧导航栏中选择“容器智能分析”,在“容器洞察 > 集群总览”页面的集群统计列表中,单击集群名称,选择“Pod”。 页面呈现了所有实例的综合信息,如需深入了解单个实
关闭监控 本章节讲述为集群关闭监控的操作流程。 约束与限制 关闭监控前,请仔细阅读以下注意事项,避免数据丢失或者相关资源继续产生费用。 kube-prometheus-stack插件处于“安装中”、“升级中”、“删除中”和“回滚中”时不允许关闭监控。 kube-prometheu
com/kubernetes/kube-state-metrics/blob/v2.2.3/docs/cli-arguments.md 父主题: 容器智能分析
节点的详细监控数据,包括CPU/内存使用率、网络流入/流出速率、磁盘读/写IO等。 功能入口 登录UCS控制台。 在左侧导航栏中选择“容器智能分析”,在“容器洞察 > 集群总览”页面的集群统计列表中,单击集群名称,选择“节点”。 页面呈现了所有节点的综合信息,如需深入了解单个节点
启监控失败。 处理手段 请在指定集群的策略实例中,取消针对kube-system和monitoring命名空间的拦截策略。 父主题: 容器智能分析