-
Master节点关机后集群控制台不可用处理方法 - 华为云UCS
Master节点关机后,出现集群控制台不可用的情况。 操作步骤 此类问题是由于Cilium社区对“Terminating”状态的Pod并不会进行Cilium Endpoint摘除,导致部分请求分流到关机节点,从而导致请求失败。请按照如下指导处理: 执行以下命令,删除“Terminating”状态的Pod。 kubectl
-
密钥(Secret) - 华为云UCS
私有仓库镜像所需的认证信息。如选择此类型的密钥,需要额外输入镜像仓库地址。 IngressTLS:存放7层负载均衡服务所需的证书。如选择此类型的密钥,需要上传证书文件及私钥文件。 其他:若需要创建其他类型的密钥,请手动输入密钥类型。 密钥数据 工作负载密钥的数据可以在容器中使用。
-
注销本地集群 - 华为云UCS
单击本地集群右上角的注销按钮,会弹出注销确认框。 确认待注销的集群名称等信息,并勾选“我已阅读并知晓上述信息”,单击“确定”即可在控制台注销本地集群。 本地资源清理 该操作可能导致与该集群有绑定关系的资源(比如指定调度集群的负载等)无法正常使用,请谨慎操作,避免对运行中的业务造成影响。
-
配置无条件触发自动切流 - 华为云UCS
策略关注的集群名列表。仅在该列表中的集群会执行指定动作,为空时不会执行任何动作。 spec.decisionMatches 触发条件列表。当上述集群列表中指定的集群满足任一触发条件时,即会执行指定动作。当列表为空时,表示无条件触发。 conditionType 触发条件的类型。当
-
更新KubeConfig文件 - 华为云UCS
本章节将指导您更新集群的KubeConfig文件,以便应对集群证书信息泄露或过期情况,或进行例行的安全维护。 更新KubeConfig文件的操作仅适用于附着集群与伙伴云集群。 前提条件 集群未加入任何舰队。 集群安装了anp-agent插件,以保证新的KubeConfig文件能与集群完成一次连通性探测。
-
log-agent插件 - 华为云UCS
log-agent是基于开源fluent-bit和opentelemetry构建的云原生日志采集插件,支持基于CRD的日志采集策略,可以根据您配置的策略规则,对集群中的容器标准输出日志、容器文件日志、节点日志及K8s事件日志进行采集与转发。 log-agent插件的核心组件包括fluent-bit、cop-log
-
实例管理 - 华为云UCS
支持通过单击,筛选对应条件下的服务实例。 支持通过实例名称查询服务实例,直接在搜索栏输入关键字即可。 单击实例名称,进入实例的基本信息页面。 服务实例的通用信息 参数 说明 版本 实例所属的服务的版本。 所属服务 实例所属的服务。 状态 当前实例的运行状态。 区域 实例所在的区域,例如“华东-上海一”。
-
容器智能分析概述 - 华为云UCS
、节点、工作负载的资源全景,支持节点的资源占用、工作负载的资源消耗,以及近一小时的CPU/内存指标展示,全面监控集群的健康状态和负荷程度。 健康诊断:对集群健康状态进行周期性检查,可以对集群、节点资源使用情况,工作负载、Pod资源状态进行快速诊断。 仪表盘:仪表盘可将不同图表展示
-
注册伙伴云集群(公网接入) - 华为云UCS
本章节讲述伙伴云集群的注册及公网接入流程。 约束与限制 仅华为云账号或具备UCS FullAccess权限的用户可进行集群注册的操作。 若集群地域位于境外,应确保您的行为符合所适用的法律法规要求。 请确保注册的集群版本在1.19至1.28之间的集群。 前提条件 已创建一个准备接入UCS的伙伴云集群,并且集群状态正常。
-
备份与恢复 - 华为云UCS
若查询到etcd容器说明服务已经重启,此时该节点的etcd数据得到恢复。 etcd数据恢复需要每个含有etcd的节点上单独执行1-5步骤。 单master节点故障恢复 在执行机上执行单节点故障恢复命令。 ./ucs-ctl restore node 节点ip --name 集群名 其中节点ip为故障节点的ip,示例如下。
-
升级集群联邦 - 华为云UCS
版本所做的变更进行说明。如下表格详细介绍了联邦版本能够升级到的目标版本,以及版本差异。 表1 联邦版本说明 版本 说明 v1.7.0-r14 修复了使用kubectl操作联邦资源的一些bug。 升级集群联邦 UCS支持查看现有联邦版本,并升级集群联邦至更新的版本。 集群联邦升级过
-
集群联邦升级前检查不通过,如何排查错误? - 华为云UCS
升级集群联邦前,UCS会对联邦运行状态、集群运行状态、集群接入状态三方面进行检查,尽可能避免升级失败。如有检查异常项,请先参考本章节内容排查与修复问题。问题修复后,可以尝试再次升级集群联邦。 升级联邦前,请您对联邦运行状态、集群运行状态、集群接入状态三方面进行检查,以避免升级失败。 现象一:集群联邦状态检查异常
-
GPU虚拟化概述 - 华为云UCS
GPU采用xGPU虚拟化技术,能够动态对GPU设备显存与算力进行划分,单个GPU卡最多虚拟化成20个GPU虚拟设备。相对于静态分配来说,虚拟化的方案更加灵活,最大程度保证业务稳定的前提下,可以完全由用户定义使用的GPU数量,提高GPU利用率。 GPU虚拟化的优势 UCS On Premises提供的GPU虚拟化功能优势如下:
-
续费概述 - 华为云UCS
包年/包月UCS服务到期后,将会以按需付费模式继续计费,不会影响其正常运行。如需继续享受套餐包价格,则需要进行续费,请进入“续费管理”页面进行续费操作。 续费操作仅适用于包年/包月计费模式,按需计费的UCS服务不需要续费,只需要保证账户余额充足即可。 续费相关的功能 华为云UCS支持从UCS控制台续费包年/包月资源,如表1所示。
-
应用迁移 - 华为云UCS
前提条件 确认云原生应用依赖的存储数据已经迁移完成。 确认源集群中元数据备份数据已经下载到执行k8clone的服务器上。 k8clone数据恢复原理 数据恢复的流程参考如下: 图1 数据恢复流程 在执行恢复操作前,需要准备一个数据恢复配置文件“restore.json”,目的是
-
服务健康 - 华为云UCS
服务健康 服务健康是通过对实际的访问情况进行统计来找出不健康的实例,属于被动型的健康检查。健康检查通过的实例,才会向服务端注册。 网格须开通AOM服务,否则无法查看服务健康。 操作步骤 登录UCS控制台,在左侧导航栏中单击“服务网格”。 单击服务网格名称,进入详情页。 在左侧导航
-
日志中心概述 - 华为云UCS
节点采集到您账号的LTS日志服务的日志流中。具体操作,请参见收集控制面组件日志和收集Kubernetes审计日志。 支持收集集群Kubernetes事件,将Kubernetes事件从集群内采集到您账号的LTS日志服务的日志流中,以便对Kubernetes事件进行持久化存储和统计分
-
命名空间 - 华为云UCS
容器组(Pod):限制命名空间下能创建Pod的最大数量,包含停止状态的Pod。 容器组(不包含停止状态的Pod):限制命名空间下能创建Pod的最大数量,不包含停止状态的Pod。 服务(Service):限制命名空间下能创建服务的最大数量,包含停止状态的Service。 服务(不包含停止状态的Service)
-
产品优势 - 华为云UCS
配应用访问流量。 数据随应用一键迁移 UCS分别针对存储设施层、容器集群层、中间件数据层提供应对不同业务场景的数据复制能力。提供跨云迁移数据自动化同步能力,同时基于数据随应用的同步复制能力,可以实现在分布式基础设施上的弹性扩容。在扩容场景中,完成零人工干预的数据扫描和重建,完成以
-
启用网格 - 华为云UCS
启用网格 网格的控制面完全托管,简化了用户运维负担和资源消耗,用户只需要基于网格进行服务管理即可。企业版网格支持多集群和多种基础设施的服务统一管理,包括跨集群灰度发布、服务治理、安全和拓扑。 约束与限制 应用服务网格依赖集群CoreDNS的域名解析能力,请确保集群拥有足够资源,且CoreDNS插件运行正常。