检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
kspider工具的架构如图1所示,包含三个模块:采集模块、连接管理和分析模块。采集模块可以收集源集群的数据,包括命名空间、工作负载、节点、网络等;连接管理模块负责与源集群的API Server建立连接;分析模块分为聚合输出和评估推荐两部分,旨在输出源集群的采集数据(生成“cluster-*.json”文
kspider工具的架构如图1所示,包含三个模块:采集模块、连接管理和分析模块。采集模块可以收集源集群的数据,包括命名空间、工作负载、节点、网络等;连接管理模块负责与源集群的API Server建立连接;分析模块分为聚合输出和评估推荐两部分,旨在输出源集群的采集数据(生成“cluster-*.json”文
集群类别与类型说明 集群类别(category) 集群类型(type) provider供应商 华为云集群(self) CCE Standard集群(cce) huaweicloud CCE Turbo集群(turbo) huaweicloud 本地集群(onpremise) 本地集群(baremetal)
准备GPU资源 本文介绍如何在使用GPU能力前所需要的基础软件、硬件规划与准备工作。 基础规划 配置 支持版本 集群版本 v1.25.15-r7及以上 操作系统 华为云欧拉操作系统 2.0 系统架构 X86 GPU类型 T4、V100 驱动版本 GPU虚拟化功能仅支持470.57
ernetes可以通过GRPC连接到工作负载并查询其状态。 图4 GRPC检查 使用GRPC检查时,您的应用需支持GRPC健康检查协议。 与HTTP和TCP探针类似,如果配置错误,都会被认作是探测失败,例如错误的端口、应用未实现健康检查协议等。 公共参数说明 表1 公共参数说明 参数
已购买资源包,为什么仍然产生按需计费? 请按表1识别产生按需计费的原因,并重新选择正确的资源包或保证账户中的余额充足。 表1 排查思路 可能原因 处理措施 购买套餐包中集群类型与实际接入的集群类型不一致 购买所接入集群类型对应的套餐包 购买套餐包中集群规模小于实际接入的集群规模 购买集群规模更大的、符合所接入集群规模的套餐包,或保证账户中的余额充足
您可以实现各节点负载的合理分配。 节点标签使用场景 节点标签的主要使用场景有两类。 节点分类:通过添加标签对节点进行分类。 工作负载与节点的亲和与反亲和: 有的工作负载需要的CPU大,有的工作负载需要的内存大,有的工作负载需要IO大,可能会影响其他工作负载正常工作,此时建议给节点
理能力,目前本地集群的升级方式为用户手动进入集群内,使用命令行工具进行升级,在 UCS 集群管理控制台提供集群升级提示以及升级指引。 约束与限制 本地集群升级要求先升级master节点和组件,再升级node节点。 集群列表页面的升级提示依赖master节点状态,需要一次完成升级,
出现该错误的原因大概率为集群还未接入,接入集群中的proxy-agent运行状态异常,或者网络异常。 排查项一:proxy-agent的运行状态 排查项二:集群与UCS网络连接状态 Unauthorized 出现该错误的原因可能是多样的,请根据实际状态码进行排查。 例如状态码401表示用户没有访问权限,可能的原因是集群认证信息过期。
选择插件 UCS提供两种插件以采集工作负载相关指标:Kubernetes Metrics Server与kube-prometheus-stack。两种插件适用的集群类型与指标类型不同,请参考表1选择插件进行安装。 表1 插件选择 适用的集群类型 支持的指标类型 插件 注意事项
关联服务 关联服务呈现了当前服务与上下游服务间的关系,增强了网格的可观测性能力,提升了网格应用管理的易用性。本节介绍如何查看网格中某服务的关联服务。 网格须开通AOM服务,否则无法查看关联服务。 操作步骤 登录UCS控制台,单击左侧导航栏中的“服务网格”,进入网格列表页。 单击服务网格名称,进入服务网格详情页。
单击“入方向规则”,单击“添加规则”,填写“协议端口”和“IP地址”信息,单击“确定”。用于放通其他region连接控制面istiod与控制面kubeapiserver的请求。例如:在北京四VPC放通广州VPC与容器网段(相同操作8-9也需要在广州执行)。 查看添加的安全组规则。 父主题: UCS服务网格 集群连通方法
败报错: 集群架构选择ARM,在X86节点上安装本地集群,则会安装失败报错。 解决方案:集群节点CPU架构暂不支持异构混部,请确认集群架构与安装部署本地集群节点的cpu架构一致。 若集群架构选择X86,请选择X86节点上安装本地集群。 若集群架构选择ARM,请选择ARM节点上安装本地集群。
集插件,支持基于CRD的日志采集策略,可以根据您配置的策略规则,对集群中的容器标准输出日志、容器文件日志、节点日志及K8s事件日志进行采集与转发。 关于插件的详细说明,请参考kube-prometheus-stack插件和云原生日志采集插件章节。 目前容器智能分析支持监控华为云集
自定义资源 自定义资源(Custom Resource Definitions, CRD)允许用户创建一个与Deployment、Service类似的定制资源对象,用户可以通过kubectl命令来创建和访问这种自定义资源,为用户提供模块化的Kubernetes扩展,详情请参考使用
集群开启监控成功后,还可以修改监控配置,网络配置、指标采集配置和事件采集配置均支持修改。 当事件采集配置从开启置为关闭,系统将会删除log-agent插件。 约束与限制 kube-prometheus-stack插件处于“安装中”、“升级中”、“删除中”、“回滚中”、“回滚失败”、“不可用”、“安装失败
FullAccess权限的用户可进行集群联邦的开通、关闭操作。 集群联邦使用流程 集群联邦的使用流程如图2所示。 图2 集群联邦使用流程 集群联邦能力与容器舰队绑定,若您需要使用集群联邦进行多集群管理,请进行以下操作: 将需要管理的集群接入UCS,并将其加入容器舰队。 为容器舰队开通集群联邦
持私网(有私有IP地址),并且开启了跨VPC后端开关,具体创建步骤请参见创建独享型负载均衡器。 打通ELB的VPC与Kubernetes集群间的网络,确保ELB实例与容器Pod IP网络可达,并保证成员集群间网络网段不冲突。 准备联邦内可用的工作负载(Deployment)和服务
gpu-device-plugin 插件简介 gpu-device-plugin插件是支持在容器中使用GPU显卡的设备管理插件,集群中使用GPU节点时必须安装本插件。 约束与限制 下载的驱动必须是后缀为“.run”的文件。 仅支持Nvidia Tesla驱动,不支持GRID驱动。 安装或重装插件时,需要保证驱动下
依赖服务迁移 本节介绍集群依赖服务的相关数据迁移,如本地存储、数据库、分布式缓存、分布式消息等。若您的集群不涉及这些数据,或者这些数据不需要搬迁上云,可忽略本节内容。 存储迁移 若您的集群使用本地存储,迁移上云可以使用华为云数据快递服务 DES。DES服务是一种海量数据传输解决方