检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
CCE推荐的GPU驱动版本列表 对于CCE集群,各系统推荐使用驱动版本如下表,若使用非CCE推荐驱动版本,需要您自行验证机型、系统及驱动版本间的配套兼容性。您可以根据您的应用所使用的CUDA Toolkit版本,对照CUDA Toolkit与NVIDIA驱动的版本兼容性列表,选择合适的NVIDIA驱动版本。
安装Spark 前提条件 您需要准备一台可访问公网的Linux机器,节点规格建议为4U8G及以上。 配置JDK 以CentOS系统为例,安装JDK 1.8。 查询可用的JDK版本。 yum -y list java* 选择安装JDK 1.8。 yum install -y java-1
排查项二:填写的镜像地址错误(使用第三方镜像时) 排查项三:使用错误的密钥(使用第三方镜像时) Failed create pod sandbox: rpc error: code = Unknown desc = failed to create a sandbox for pod "nginx-6dc48bf8b6-l8xrw":
请检查镜像URL是否正确。 FailedPullImage 请检查镜像URL是否正确。 ErrImageNeverPull 请检查本地镜像,建议将镜像拉取策略设置为IfNotPresent或Always。 InspectFailed 请检查镜像的完整性。 FailedPostStartHook
e > 节点thinpool空间大小,理论上有概率出现节点thinpool空间耗尽的场景。 操作系统与容器存储Rootfs对应关系 表1 CCE集群节点操作系统与容器引擎对应关系 操作系统 容器存储Rootfs 自定义Pod容器空间(basesize) CentOS 7.x v1
spec.claimRef.apiVersion 固定值"v1"。 spec.claimRef.kind 固定值"PersistentVolumeClaim"。 spec.claimRef.name 与下一步创建的pvc的name一致。 spec.claimRef.namespace
icSearch搜索等场景。 AI加速型:AI加速型节点实例,搭载高性能、低功耗的海思Ascend 310 AI处理器,实现快速高效地处理推理和图像识别等工作,适用于图像识别、视频处理、推理计算以及机器学习等场景。 通用型(节点规格为4U8G) 系统盘类型 高IO:后端存储介质为SAS类型。
集群漏洞修复周期 高危漏洞: Kubernetes社区发现漏洞并发布修复方案后,CCE一般在1个月内进行修复,修复策略与社区保持一致。 操作系统紧急漏洞按照操作系统修复策略和流程对外发布,一般在一个月内提供修复方案,用户自行修复。 其他漏洞: 按照版本正常升级流程解决。 修复声明 为了防止
m。 取值范围: 不涉及 默认取值: 不涉及 os 否 String 参数解释: 节点的操作系统类型。具体支持的操作系统请参见节点操作系统说明。 约束限制: 若当前集群版本不支持该OS类型,则会自动替换为当前集群版本支持的同系列OS类型。 若在创建节点时指定了extendParam中的alpha
Worker: replicas: 2 restartPolicy: OnFailure template: spec: containers: - name: tensorflow
e > 节点thinpool空间大小,理论上有概率出现节点thinpool空间耗尽的场景。 操作系统与容器存储Rootfs对应关系 表1 CCE集群节点操作系统与容器引擎对应关系 操作系统 容器存储Rootfs 自定义Pod容器空间(basesize) CentOS 7.x v1
支持的对象存储类型 参数值 描述 use_ino 并行文件系统 无需填写 使用该选项,由obsfs分配inode编号。读写模式下自动开启。 big_writes 并行文件系统 对象桶 无需填写 配置后可更改写缓存最大值大小。 nonempty 并行文件系统 对象桶 无需填写 允许挂载目录非空。 allow_other
accessModes: - ReadWriteMany persistentVolumeReclaimPolicy: Retain # PV回收策略必须为Retain storageClassName: csi-obs volumeMode: Filesystem
nodes are available: 1 Insufficient cpu, 2 node(s) had taint {cie.manage: proxy}, that the pod didn't tolerate, 3 node(s) had taint {node.kubernetes
方案概述 DevOps是一组过程、方法与系统的统称,通过一系列手段来促进开发(应用程序/软件工程)部门与技术运营和质量保障(QA)部门之间的密切沟通、高效协作与整合。通过自动化的软件交付和架构变更流程,让规划、开发、构建、测试、发布、部署、维护都能更快、更频繁、更可靠,保障开发结
spec.claimRef.apiVersion 固定值"v1"。 spec.claimRef.kind 固定值"PersistentVolumeClaim"。 spec.claimRef.name 与下一步创建的pvc的name一致。 spec.claimRef.namespace
everest.io/sfs-version: sfs3.0 # 使用通用文件系统(SFS 3.0) persistentVolumeReclaimPolicy: Retain # 回收策略 storageClassName: csi-nas
replicas是2,如果maxSurge和maxUnavailable都为默认值25%,那实际升级过程中,maxSurge允许最多3个Pod存在(向上取整,2*1.25=2.5,取整为3),而maxUnavailable则不允许有Pod Unavailable(向上取整,2*0.75=1.5,
io/reclaim-policy: retain-volume-only 否 可选字段 目前仅支持配置“retain-volume-only” everest插件版本需 >= 1.2.9且回收策略为Delete时生效。如果回收策略是Delete且当前值设置为“retain-volu
om。 取值范围: 不涉及 默认取值: 不涉及 os String 参数解释: 节点的操作系统类型。具体支持的操作系统请参见节点操作系统说明。 约束限制: 若当前集群版本不支持该OS类型,则会自动替换为当前集群版本支持的同系列OS类型。 若在创建节点时指定了extendParam中的alpha