检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
弹性伸缩 简介 当使用bursting插件Pod弹性到CCI 2.0上时,metrics-server插件无法采集这部分Pod的指标数据,可能会影响HPA工作。通过阅读本章节,可以使用云原生监控插件替换metrics-server插件,以使HPA功能正常。 操作步骤 安装“云原生监控插件”。
命名空间是对一组资源和对象的抽象整合。在同一个集群内可创建不同的命名空间,不同命名空间中的数据彼此隔离,使得它们既可以共享同一个集群的服务,也能够互不干扰。命名空间的一个重要的作用是充当一个虚拟的集群,用于多种工作用途,满足多用户的使用需求。 本章节将沿用创建用户并授权使用CCI中创建的IAM用户
间时会关联已有VPC或创建一个新的VPC,并在VPC下创建一个子网。后续在该命名空间下创建Pod、Service等资源时都会在对应的VPC及子网之内,且占用子网中的IP地址。 通常情况下,如果您在同一个VPC下还会使用其他服务的资源,您需要考虑您的网络规划,如子网网段划分、IP数量规划等,确保有可用的网络资源。
'true’, then the output is pretty printed. 请求消息 请求参数: 请求参数的详细描述请参见表165。 请求示例: 更改PyTorchJob的结束存活时间ttlSecondsAfterFinished: { "apiVersion": "kubeflow
对于SFS多读场景,数据存在缓存的情况,会导致原数据读取延迟。如果需要实时读取数据,可为已创建的文件系统指定挂载参数。 挂载参数可设置mount命令指定文件系统挂载的选项,当前仅支持noac,即用于禁止本地的文件和目录缓存,支持客户端实时从远端SFS读取数据。 此处设置的挂载参数仅对当前命名空间下创建的文件存储卷有效。
创建PyTorchJob。 PyTorchJob即PyTorch任务,是基于PyTorch开源框架的kubernetes自定义资源类型,有多种角色可以配置,能够帮助我们更简单地实现PyTorch的训练。 URI POST /apis/kubeflow.org/v1/namespaces/
功能介绍 创建MXJob。 MXJob即MXNet任务,是基于MXNet开源框架的kubernetes自定义资源类型,有多种角色可以配置,能够帮助我们更简单地实现MXNet的训练。MXNet开源框架的信息详见:https://mxnet.incubator.apache.org/。
TFJob即Tensorflow任务,是基于Tensorflow开源框架的kubernetes自定义资源类型,有多种角色可以配置,能够帮助我们更简单地实现Tensorflow的单机或分布式训练。Tensorflow开源框架的信息详见:https://www.tensorflow.org 。
No If 'true’, then the output is pretty printed. 请求消息 请求参数的详细描述请参见表154。 请求示例: 更改TFJob的结束存活时间ttlSecondsAfterFinished: { "apiVersion": "kubeflow
计费FAQ 删除工作负载后,会持续扣费 创建的工作负载,在删除后,“我的资源”中显示依然存在,且会持续扣费,建议您确认下该命名空间下是否还有Pod在运行,如需停用,请删除Pod,后台会停止计费。 账户有余额,仍提示欠费 问题现象: 账户重置后有余额,在CCI中新建命名空间仍然提示欠费,无法操作。
'true’, then the output is pretty printed. 请求消息 请求参数: 请求参数的详细描述请参见表162。 请求示例: 更改MXJob的结束存活时间ttlSecondsAfterFinished: { "apiVersion": "kubeflow
查询PyTorchJob 功能介绍 查询PyTorchJob的详细信息。 URI GET /apis/kubeflow.org/v1/namespaces/{namespace}/pytorchjobs/{name} 表1 Path参数 参数 是否必选 描述 name Yes name
如何上传镜像? 镜像的管理是由容器镜像服务(SoftWare Repository)提供的,当前容器镜像服务提供如下两种上传镜像的方法: 客户端上传镜像 页面上传镜像 父主题: 镜像仓库类
约束与限制 您能创建的云容器实例资源的数量与配额有关系,具体请参见服务配额。如果您需要扩大配额,请参见如何申请扩大配额。 更详细的限制请参见具体API的说明。 父主题: 使用前必读
对象存储服务(OBS)是一个基于对象的海量存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力。OBS的更多信息,请参见对象存储服务。 使用限制 待挂载的对象存储必须是按需付费,更多信息,请参见请参见对象存储计费。 请谨慎执行对象存储的删除操作,以避免造成CCI中容器不可用。
查询MXJob 功能介绍 查询MXJob的详细信息。 URI GET /apis/kubeflow.org/v1/namespaces/{namespace}/mxjobs/{name} 表1 Path参数 参数 是否必选 描述 name Yes name of the MXJob
查询TFJob 功能介绍 查询TFJob的详细信息。 URI GET /apis/kubeflow.org/v1/namespaces/{namespace}/tfjobs/{name} 表1 Path参数 参数 是否必选 描述 name Yes name of the TFJob
使用sample镜像创建工作负载无法运行 当您使用过容器镜像服务(SWR)但没有上传过镜像时,容器镜像服务会为您预置一个名为sample的镜像,该镜像无法运行,建议您直接使用开源镜像中心的镜像创建负载。 父主题: 容器工作负载类
公网能正常访问的前提是负载已处于运行中状态,如果您的负载处于未就绪或异常状态,公网访问将无法正常使用。 从负载开始创建到公网可以正常访问可需要1分钟到3分钟的时间,在此时间内网络路由尚未完成配置,请稍作等待。 负载创建3分钟以后仍然无法访问。在“工作负载 -> 查看您创建的负载详情->
CCI 上传镜像包需要开通什么权限? 当前在CCI中上传镜像使用的是华为云的“SWR容器镜像服务”。 需要为账号添加Tenant Administrator权限。SWR权限的详细内容可参考SWR权限。 上传镜像的具体步骤可参考客户端上传镜像或页面上传镜像。 父主题: 镜像仓库类