检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
更新MXJob 功能介绍 更新MXJob。如下字段可被更新: metadata.labels metadata.annotations spec.activeDeadlineSeconds spec.ttlSecondsAfterFinished spec.cleanPodPolicy
创建PyTorchJob 功能介绍 创建PyTorchJob。 PyTorchJob即PyTorch任务,是基于PyTorch开源框架的kubernetes自定义资源类型,有多种角色可以配置,能够帮助我们更简单地实现PyTorch的训练。 URI POST /apis/kubeflow
删除PyTorchJob 功能介绍 删除PyTorchJob。 URI DELETE /apis/kubeflow.org/v1/namespaces/{namespace}/pytorchjobs/{name} 表1 Path参数 参数 是否必选 描述 name Yes name
更新PyTorchJob 功能介绍 更新PyTorchJob。如下字段可被更新: metadata.labels metadata.annotations spec.activeDeadlineSeconds spec.ttlSecondsAfterFinished spec.cleanPodPolicy
使用OBS存储挂载失败 问题现象: 单击“工作负载 > 任务 ”,实例状态显示“失败”。 图1 Pod状态 单击“事件”页,查看异常事件,如下图: 图2 事件类型异常 在Pod列表,单击失败实例后的“查看日志”,跳转到应用运维管理AOM界面。 图3 Pod列表 在应用运维管理AOM界面,单击“日志
CCI 上传镜像包需要开通什么权限? 当前在CCI中上传镜像使用的是华为云的“SWR容器镜像服务”。 需要为账号添加Tenant Administrator权限。SWR权限的详细内容可参考SWR权限。 上传镜像的具体步骤可参考客户端上传镜像或页面上传镜像。 父主题: 镜像仓库类
io/v1beta1 请求参数 表1 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 通过调用IAM服务获取用户Token接口获取(响应消息头中X-Subject-Token的值)。 响应参数 状态码: 200 表2 响应Body参数
printed. 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 通过调用IAM服务获取用户Token接口获取(响应消息头中X-Subject-Token的值)。 响应参数 状态码: 200 表4 响应Body参数
弹性伸缩策略如何配置? 云容器实例支持告警、定时、周期三种弹性伸缩策略。具体配置方法请参见伸缩负载。 父主题: 容器工作负载类
CCI是否支持高速IB(Infiniband)网络? 不支持。 父主题: 网络管理类
CCI Administrator有上传镜像包的权限吗? 当前在CCI中上传镜像使用的是华为云的“SWR容器镜像服务”。 您还需要为账号添加Tenant Administrator权限。 父主题: 镜像仓库类
删除工作负载后,会持续扣费。 创建的工作负载,在删除后,“我的资源”中显示依然存在,且会持续扣费,建议您确认下该命名空间下是否还有Pod在运行,如需停用,请删除Pod,后台会停止计费。 父主题: 容器工作负载类
CCI是否提供基础容器镜像的下载服务? CCI中的镜像仓库是由容器镜像服务(SoftWare Repository)提供,容器镜像服务提供基础容器镜像的下载。 父主题: 镜像仓库类
为什么界面不显示工作负载终端? 工作负载终端,显示异常。 请先排除欠费因素。 父主题: 容器工作负载类
删除namespace下的所有PyTorchJob 功能介绍 删除命名空间下的所有PyTorchJob。 URI DELETE /apis/kubeflow.org/v1/namespaces/{namespace}/pytorchjobs 表1 Path参数 参数 是否必选 描述
删除namespace下的所有MXJob 功能介绍 删除命名空间下的所有MXJob。 URI DELETE /apis/kubeflow.org/v1/namespaces/{namespace}/mxjobs 表1 Path参数 参数 是否必选 描述 namespace Yes
使用sample镜像创建工作负载无法运行 当您使用过容器镜像服务(SWR)但没有上传过镜像时,容器镜像服务会为您预置一个名为sample的镜像,该镜像无法运行,建议您直接使用开源镜像中心的镜像创建负载。 父主题: 容器工作负载类
查询指定namespace下的所有MXJob 功能介绍 查询Namespace下所有MXJob的详细信息。 URI GET /apis/kubeflow.org/v1/namespaces/{namespace}/mxjobs 表1 Path参数 参数 是否必选 描述 namespace
查询指定namespace下的所有PyTorchJob 功能介绍 查询Namespace下所有PyTorchJob的详细信息。 URI GET /apis/kubeflow.org/v1/namespaces/{namespace}/pytorchjobs 表1 Path参数 参数
a/lib64到LD_LIBRARY_PATH,才能正确地找到cuda库。 解决方法: 使用kubectl exec或者前端console登录进入带GPU的容器时,先执行命令export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/nv