检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
内核参数配置 CCI服务底座使用安全容器构建了业内领先的Serverless容器平台,同物理机系统内核隔离且互不影响。对于资深业务部署场景,内核参数调优是比较通用的方式。在安全范围内,CCI服务允许客户根据Kubernetes社区推荐的方案,通过Pod的安全上下文(Security
/entrypoint.sh"] CMD ["start"] 上面是一个Dockerfile文件,包含一些常见的参数ENV、VOLUME、EXPOSE、ENTRYPOINT、CMD,这些参数在云容器实例中可以按如下方法配置。 ENV为环境变量,在云容器实例中创建负载的时候,可以在高级配置中设置,“ENV
为了支持查看GPU使用情况的场景,需要在镜像中注入nvidia-smi工具,根据购买的专属节点GPU驱动版本选择不同的nvidia-smi二进制文件。 nvidia-smi获取方式。 该二进制文件可以在nvidia官网,根据CUDA Toolkit版本选择下载对应版本的nvidia驱动包。 图1 NVIDIA驱动程序下载
日志出现重复/丢失的原因 日志出现重复 原因一:日志文件转储,且转储文件仍被匹配到。 详细说明:如果配置日志路径文件名中有通配符,如配置为/tmp/*.log,当/tmp/test.log文件转储为/tmp/test.001.log后,因仍被通配规则匹配到,会被视为新文件,则会被重新采集。
magePullSecrets字段(如下yaml示例中的加粗字段),表示pull镜像时的secret名称。 需要使用容器镜像服务的镜像时,参数值固定为imagepull-secret。 apiVersion: apps/v1 kind: Deployment metadata:
云容器实例支持“手工输入”和“文件上传”两种方式来创建Secret。 方式一:手工输入。参照表1设置基本信息,其中带“*”标志的参数为必填参数。 表1 基本信息说明 参数 参数说明 基本信息 *密钥名称 新建Secret的名称。 以小写字母或数字开头,小写字母、数字、中划线(-)、点(.)组
pace}/tfjobs 表1 Path参数 参数 是否必选 描述 namespace Yes object name and auth scope, such as for teams and projects 表2 Query参数 参数 是否必选 描述 fieldSelector
表1 Path参数 参数 是否必选 描述 name Yes name of the MXJob namespace Yes object name and auth scope, such as for teams and projects 表2 Query参数 参数 是否必选 描述
表1 Path参数 参数 是否必选 描述 name Yes name of the TFJob namespace Yes object name and auth scope, such as for teams and projects 表2 Query参数 参数 是否必选 描述
Path参数 参数 是否必选 描述 name Yes name of the PyTorchJob namespace Yes object name and auth scope, such as for teams and projects 表2 Query参数 参数 是否必选
表1 Path参数 参数 是否必选 描述 name Yes name of the TFJob namespace Yes object name and auth scope, such as for teams and projects 表2 Query参数 参数 是否必选 描述
可,也可以不添加user-name参数。 IAM的Endpoint请参见地区和终端节点,请注意需要使用与云容器实例地区相同的Endpoint。 在非安全的环境中使用kubectl,建议您完成此步骤后,使用环境变量的方式重新配置认证信息,具体参考非安全环境配置kubectl。 配置
表1 Path参数 参数 是否必选 描述 name Yes name of the MXJob namespace Yes object name and auth scope, such as for teams and projects 表2 Query参数 参数 是否必选 描述
/pytorchjobs 表1 Path参数 参数 是否必选 描述 namespace Yes object name and auth scope, such as for teams and projects 表2 Query参数 参数 是否必选 描述 fieldSelector
Path参数 参数 是否必选 描述 name Yes name of the PyTorchJob namespace Yes object name and auth scope, such as for teams and projects 表2 Query参数 参数 是否必选
/pytorchjobs 表1 Path参数 参数 是否必选 描述 namespace Yes object name and auth scope, such as for teams and projects 表2 Query参数 参数 是否必选 描述 fieldSelector
pace}/tfjobs 表1 Path参数 参数 是否必选 描述 namespace Yes object name and auth scope, such as for teams and projects 表2 Query参数 参数 是否必选 描述 fieldSelector
pace}/mxjobs 表1 Path参数 参数 是否必选 描述 namespace Yes object name and auth scope, such as for teams and projects 表2 Query参数 参数 是否必选 描述 fieldSelector
云容器实例支持“手工输入”和“文件上传”两种方式来创建ConfigMap。 方式一:手工输入。参照表1设置新增配置参数,其中带“*”标志的参数为必填参数。 表1 新建配置参数说明 参数 参数说明 基本信息 *配置项名称 新建的ConfigMap名称。 请输入以小写字母或数字开头,小写字母、数字、中划线(-)、点(
在容器设置下面的高级设置中,挂载一个NFS类型的文件存储卷,用于保存训练后的数据。 图3 挂载NFS存储 在启动命令中输出执行命令和参数。 可执行命令:/bin/bash 参数1:-c 参数2:python /home/project/gpu-demo/cifar10/cifar10_multi_gpu_train