检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
伴云集群)、集群vCPU数量和购买时长决定。如需了解如何查看所接入集群的vCPU数量,请参见查看集群的vCPU数量。 UCS服务管理费用不包括任何资源(例如计算节点、网络服务等)相关的费用。 假设您计划购买一个UCS服务的套餐包,则需要选择或设置所需的套餐包规格,如图1所示。其中,需要您配置的规格如表2所示。
和状态等,并对工作负载的配置进行修改。 图1 工作负载详情页 编辑YAML 可通过在线YAML编辑窗对无状态工作负载、有状态工作负载、守护进程集、定时任务和容器组的YAML文件进行修改和下载。普通任务的YAML文件仅支持查看、复制和下载。本文以无状态工作负载为例说明如何在线编辑YAML。
管理本地集群 本地集群KubeConfig文件 本地集群配置文件 管理本地集群节点 管理本地集群网络 升级本地集群 注销本地集群 使用ucs-ctl命令行工具管理本地集群 GPU调度 NPU调度 备份与恢复 父主题: 本地集群
本地集群配置文件 本地集群配置文件为一个Cluster.yaml文件,是在UCS 控制台中自动生成,用于初始化本地集群的master节点。表1是该文件内各个字段的说明。 表1 命令 配置项 配置命令 # ssh登录master节点用户 USERNAME: root # ssh登录master节点密码
在购买集群或集群内资源后,如果发现当前计费模式无法满足业务需求,您还可以变更计费模式。 计费项 华为云UCS的计费项由UCS管理服务费用组成,根据集群vCPU的数量按小时计费,如需查看每个用户集群的vCPU容量(计入UCS费用的部分),可运行以下命令: kubectl get nodes
容器洞察:提供基于Kubernetes原生类型的容器监控能力,支持集群、节点、工作负载的资源全景,支持节点的资源占用、工作负载的资源消耗,以及近一小时的CPU/内存指标展示,全面监控集群的健康状态和负荷程度。 健康诊断:对集群健康状态进行周期性检查,可以对集群、节点资源使用情况,工作负载、Pod资源状态进行快速诊断。
在“可安装插件”中找到gpu-device-plugin,单击“安装”。 在安装插件页面,填写插件配置。 插件规格:可配置“默认”或“自定义”规格,请根据实际情况选择。 容器:选择“自定义”规格时支持设置。 Nvidia驱动:您可使用CCE提供的驱动地址或手动填写自定义Nvidia驱动的地址
择资源使用模式: 整卡模式:整卡模式采用 Kubernetes 默认的调度方式,将 Pod 调度至满足 GPU 资源需求的节点上。 共享模式:共享模式可将多个 Pod 调度至同一张 GPU 卡上抢占式运行,负载资源使用率波动较大时能提高空闲 GPU 资源使用率 虚拟化模式:采用自研的
群、多云集群和伙伴云集群)、集群vCPU数量和购买时长决定。如需了解如何查看所接入集群的vCPU数量,请参见查看集群的vCPU数量。 UCS服务管理费用不包括任何资源(例如计算节点、网络服务等)相关的费用。 包年/包月、按需计费 集群规模 *规格单价 *购买时长 具体定价请参见华为云UCS价格详情。
节点的通信情况。 ping 对端集群节点的IP地址 ping通则表示本端集群节点与对端集群节点间可以通信。 进入本端集群容器,执行以下命令,验证本端集群容器与对端集群容器的通信情况。 curl 对端集群Pod的IP地址 curl通则表示本端集群容器与对端集群容器间可以通信。 父主题:
文件存储(SFS):提供按需扩展的高性能文件存储(NAS),可为容器提供文件共享访问,用于需要多读多写的文件持久化存储,适用于多种工作负载场景,包括媒体处理、内容管理和Web服务、大数据和分析应用程序等场景。 对象存储(OBS):对象存储没有总数据容量和对象/文件数量的限制,为用户提供了超大存储容量的
创建Deployment、StatefulSet、DaemonSet等不同类型的工作负载时添加Service的方法一致。 参考创建无状态负载、创建有状态负载或创建守护进程集,在服务配置步骤,单击,进行工作负载服务配置。 Service名称:自定义服务名称,取值范围为1-50字符。 访问类型:选择“节点访问 NodePort”。
上传kubectl的配置文件来完成集群认证,支持JSON或YAML格式。获取KubeConfig文件的操作步骤因厂商而异,请参见KubeConfig。 选择Context* 选择对应的Context。在完成KubeConfig文件上传后,选项列表将自动获取文件中的“contexts”字段。
ar代理自动安装asm-mesh-controller插件,node代理自动安装asm-terrace插件。 单击页面中“查看进度”,弹出的网格启用进度中显示:资源创建、环境准备、组件安装、舰队集群接入四个阶段任务信息。 方法二:从容器舰队入口创建 登录UCS控制台,单击左侧导航栏中的“容器舰队”。
上传数据,不影响用户后续数据的读写,但Restic不进行文件内容的校验和业务一致性校验,其特性遵循restic约束。 Restic组件占用内存大小与初次备份的PV卷数据大小有关。若PV卷数据大于300G,建议采用云存储提供的迁移方式。若使用应用数据管理功能迁移大量PV数据,可修改
启动命令:容器将会以该启动命令启动,请参见启动命令。 启动后处理:容器启动后触发,请参见启动后处理。 停止前处理:容器停止前触发。设置停止前处理,确保升级或实例删除时可提前将实例中运行的业务排水。详细请参见停止前处理。 启动命令 在默认情况下,镜像启动时会运行默认命令,如果想运行特定命令或重写镜像默认值,需要进行相应设置。
上传kubectl的配置文件来完成集群认证,支持JSON或YAML格式。获取KubeConfig文件的操作步骤因厂商而异,请参见KubeConfig。 选择Context* 选择对应的Context。在完成KubeConfig文件上传后,选项列表将自动获取文件中的“contexts”字段。
更新容器舰队描述信息 更新容器舰队关联权限策略 更新容器舰队的联邦对应的zone 获取容器舰队列表 启用容器舰队联邦 关闭容器集群联邦 查询联邦开启进度 创建联邦网络连接并下载联邦kubeconfig 创建联邦网络连接 下载联邦kubeconfig 父主题: API
为网格添加集群 企业版网格支持对多个集群进行管理,且支持服务跨集群通信。 约束与限制 目前支持v1.21、v1.23和v1.25版本的集群加入企业版网格。 为了满足高可用的要求,集群需要至少包含两个可用节点,每个节点至少保证有2U4G的可用资源。 集群的容器网段不能和网格内已有集
理插件。 服务升级/回退 当服务提供商发布新版本后,可选择升级服务。升级服务后,该服务已部署的实例也将会被升级。 当实例状态处于变更中或状态异常时,无法进行升级或回退。 升级前请确保环境中所有主机处于正常运行状态,且升级过程中不能出现主机断电、断网等的情况。 升级过程中请不要执行