检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过节点池升级节点的GPU驱动版本 如果您使用的CUDA库无法与当前的NVIDIA驱动版本匹配,您需要升级节点的驱动版本才可以正常使用GPU节点。
Secret落盘加密:您可以使用KMS密钥对CCE中存储的Kubernetes Secret对象进行信封加密。详情请参见使用KMS进行Secret落盘加密。 禁止集群删除:防止通过控制台或API误删除集群,开启后将禁止删除或退订集群。
系统角色 拥有该权限的用户必须同时拥有以下权限: 全局服务:OBS Buckets Viewer、OBS Administrator。
若未查询到Metrics API,要将其开启,可手动创建对应APIService对象。 创建一个文件,命名为metrics-apiservice.yaml。
场景分类 相关最佳实践 创建节点相关实践 制作CCE节点自定义镜像 创建节点时执行安装前/后脚本 创建节点时使用OBS桶实现自定义脚本注入 选择合适的节点数据盘大小 节点日常管理实践 存储扩容 通过Core Dump文件定位容器问题 容器与节点时区同步 将节点容器引擎从Docker
场景分类 相关最佳实践 创建节点池相关实践 制作CCE节点自定义镜像 创建节点时执行安装前/后脚本 创建节点时使用OBS桶实现自定义脚本注入 选择合适的节点数据盘大小 节点池日常管理实践 存储扩容 通过Core Dump文件定位容器问题 容器与节点时区同步 将节点容器引擎从Docker
通过动态存储卷使用文件存储:即动态创建的方式,无需预先创建文件存储,在创建PVC时通过指定存储类(StorageClass),即可自动创建文件存储和对应的PV对象。适用于无可用的底层存储,需要新创建的场景。
Namespace的隔离说明 Namespace只能做到组织上划分,对运行的对象来说,它不能做到真正的隔离。
/CCE Turbo 带宽对象ID,负载均衡器IPv6公网访问所需配置参数。
/CCE Turbo 带宽对象ID,负载均衡器IPv6公网访问所需配置参数。
通过动态存储卷使用云硬盘:即动态创建的方式,无需预先创建云硬盘,在创建PVC时通过指定存储类(StorageClass),即可自动创建云硬盘和对应的PV对象。适用于无可用的底层存储,需要新创建的场景。
请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。
您需要获取数据库的配置文件,如下“服务器地址”、“数据库名称”、“数据库登录用户名”和“数据库登录密码”将通过环境变量方式注入。
伸缩对象 规格选择:对节点池中的节点规格单独设置是否开启弹性伸缩。 当节点池中包含多个规格时,您可以对每个规格的节点数范围和优先级进行单独配置。 配置完成后,单击“确定”。 父主题: 管理节点池
图1 Pod间访问 使用Service解决Pod的访问问题 Kubernetes中的Service对象就是用来解决上述Pod访问问题的。
参数类型 描述 cluster_version 否 String CCE集群版本 device_version 是 String 插件的版本 driver_version 是 String 插件安装驱动时,插件里负责安装驱动的Pod的镜像tag,一般与device_version相同 obs_url
具体操作,请参考配置网络策略限制Pod访问的对象。 节点PLEG异常-PLEG is not healthy 问题根因 Pod生命周期事件生成器PLEG(Pod Lifecycle Event Generator)会记录Pod生命周期中的各种事件,如容器的启动、终止等。
nvidia驱动建议放在OBS桶里,并设置为公共读。 相关链接 GPU节点使用nvidia驱动启动容器排查思路 GPU插件安装 父主题: 工作负载异常问题排查
必选 metadata 资源对象的元数据定义。 必选 name deployment的名称。 必选 spec 用户对deployment的详细描述的主体部分都在spec中给出。 必选 replicas 实例数量。
(--lock-object-namespace用来定义锁对象的命名空间,--lock-object-name用来定义锁对象的名称) 在Kubernetes 1.28版本,KMSv1已弃用,以后只会接收安全更新。请改用KMSv2。