检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
k8spspprivilegedcontainer 基本信息 策略类型:安全 推荐级别:L3 生效资源类型:Pod 参数: exemptImages:字符串数组 作用 禁止PodSecurityPolicy中的“privileged”字段为true。
k8srequiredresources 基本信息 策略类型:合规 推荐级别:L1 生效资源类型:Pod 参数: exemptImages:字符串数组 limits cpu memory requests cpu memory 作用 约束容器资源使用。
获取cce集群信息失败 UCS.01030011 400 Cluster category not supported 不支持该集群类别 UCS.01030012 400 Register cce cluster error 注册cce集群失败 UCS.01030013 400 Register
第二步授权(UCS控制台):拥有UCS FullAccess权限的UCS管理员分别为用户组1、用户组2创建各自的管理员权限、只读权限,然后关联到舰队上。
重启节点前需要排空节点中的Pod,在进行升级重启的操作。请注意预留GPU资源以满足节点排空过程中的Pod调度需求,防止资源不足导致Pod调度失败影响业务运行。 对于linux 5.x内核系统,如华为云欧拉操作系统 2.0或ubuntu 22.04,建议使用470及以上版本驱动。
/ucs-ctl restore cluster gpu-test -b /home/ggz/gpu-test/backup-file-20230625164904.tar.gz 若回显如下命令,则多master节点故障恢复成功: restore cluster successfully
对于华为云集群(CCE集群、CCE Turbo集群)的操作权限以IAM权限或者CCE RBAC权限为准。 授权流程 图1 给用户授予Kubernetes资源权限流程 创建用户。 管理员账号在IAM控制台创建一个用户。 为用户授予UCS系统策略。
图3 权限关系示意图 约束与限制 本地集群支持使用华为云IAM Token访问Kube APIServer;同时,不对UCS的系统策略(UCS FullAccess、UCS CommonOperations、UCS CIAOperations和UCS ReadOnlyAccess)
排查项三:集群kube-apiserver状态 “cluster responded with non-successful status code: ...” 出现该错误的原因可能是多样的,请根据实际状态码进行排查。
访问密钥ID* AWS IAM处获取的访问密钥ID,即AccessKeyID。 私有访问密钥* AWS IAM处获取的私有访问密钥,即SecretAccessKey。 容器网段* 创建的Kubernetes集群的容器网段。 服务网段 创建的Kubernetes集群的服务网段。
传入的cluster ID必须符合k8s UUID的格式规则;同时需要用户有对应集群的获取权限,否则会鉴权失败 URI GET /v1/clusters/{clusterid} 表1 路径参数 参数 是否必选 参数类型 描述 clusterid 是 String 集群ID 请求参数
若插件运行的集群为CCE turbo类型集群,在安装插件完成后,需要参考为Pod配置EIP为asm-system命名空间下,名为asm-service-controller的pod绑定eip,才能正常使用该插件功能。 父主题: 服务网格
使用以下内容,保存为deployment.yaml文件,创建istio-ingressgateway deployment工作负载。
排查项三:集群认证信息变化 Get cluster namesapce[x] failed. Or Reason:namespace "x" not found. 出现该错误的原因是集群内没有对应的命名空间。 在集群下创建对应的命名空间并进行重试操作。
表2 集群异常状态污点 污点键 容忍策略 cluster.karmada.io/not-ready 集群状态为not ready时自动添加该污点,持续时长超出容忍时长后会自动驱逐该集群上所有Pod。
访问日志 服务网格提供了访问日志查询能力,可对网格中数据面所有Proxy的AccessLog进行采集。本文介绍如何查看采集的访问日志。 网格需已“启用访问日志”能力,如何开启请参考启用网格。 操作步骤 登录UCS控制台,单击左侧导航栏中的“服务网格”,进入服务网格列表页。
apiVersion: gateway.networking.k8s.io/v1beta1 kind: HTTPRoute metadata: name: nginx-canary # 网关路由名 namespace: whtest # 网关路由所在的命名空间 spec:
约束限制 当前自动切流仅支持CCE Turbo 1.21及以上版本集群。 父主题: 配置MCI自动切流
$ kubectl create -f affinity.yaml deployment.apps/gpu created $ kubectl get pod -o wide NAME READY STATUS RESTARTS
kubectl describe pod proxy-agent-*** -nkube-system 可能出现如下错误: K8s事件显示集群无法拉取proxy-agent镜像,请您确保集群具备访问公网的能力,可正常拉取SWR镜像。