检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
html。 创建Tensorflow负载 登录云容器实例管理控制台。 创建GPU型命名空间,填写命名空间名称,设置好VPC和子网网段后,单击“创建”。 图1 GPU型命名空间 左侧导航栏中选择“工作负载 > 无状态(Deployment)”,在右侧页面中单击“镜像创建”。 配置负载信息。
用健康状况。 云容器实例基于Kubernetes,提供了两种健康检查的方式: 应用存活探针(liveness probe),探测应用是否已经启动:该检查方式用于检测容器是否存活,类似于我们执行ps命令检查进程是否存在。如果容器的存活检查的结果为失败,云容器实例会对该容器执行重启操
排查项四:命名空间的资源类型错误 请检查创建命名空间时选择的资源类型是否正确,通用计算型和GPU加速型支持X86镜像。 登录控制台,在页面上单击失败的工作负载,进入负载详情界面。 查看Pod列表,单击实例异常Pod所在行“操作”列的“查看日志”。 查看报错信息如下。 ERROR: exec failed:
] } 示例2:拒绝用户删除命名空间 拒绝策略需要同时配合其他策略使用,否则没有实际作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先原则。 如果您给用户授予CCIFullAccess的系统策略,但不希望用户拥有CCIFullAcc
使用CCE集群+bursting基于如下模型,用户需要重点关注下发负载和调度。 下发负载涉及到用户给负载进行的配置项,和用户自身的业务高度相关。 工作负载配置项 功能描述 功能规格 相关文档拓展 调度 用户可以通过多种方式来管理CCE集群的工作负载,来控制其调度到CCI服务。通过合理的调度策略配置,提升用户集群的资源利用率。
查看资源使用率 当您创建完工作负载后,您也许会非常关心每个Pod的资源利用率。 云容器实例提供了查看CPU/内存、GPU/显存的界面,您只需要在无状态负载、任务、定时任务中Pod列表的“监控”Tab下即可查看资源使用率,如图1所示。 您也可以在Pod管理中查看所有Pod的资源使用率。
I。 CCI实例限制 下表为CCI实例相关的使用限制。 限制项 限制描述 创建CCI实例的用户账号限制 已通过实名认证。 单个用户的资源数量和容量配额限制 云容器实例对单个用户的资源数量和容量限定了配额,您可以登录华为云控制台,在“资源 > 我的配额>服务配额”页面,查看各项资源的总配额及使用情况。
负载创建 概述 使用Docker run运行容器 使用控制台创建负载 调用API创建负载 Dockerfile参数在云容器实例中如何使用
存储管理 通过创建子用户方式,缩小OBS场景下上传ak/sk的权限
查询用户所有Deployments 功能介绍 查询用户所有Deployment。 调用方法 请参见如何调用API。 URI GET /apis/apps/v1/deployments 表1 Query参数 参数 是否必选 参数类型 描述 allowWatchBookmarks 否
附录 PATCH请求方法操作说明 PATCH请求方法操作示例 约束限制 Namespace和Network 状态码 错误码 获取项目ID 获取账号ID 获取容器镜像地址 挂载OBS使用限制
API Metrics EIPPool Network
GPU负载 使用Tensorflow训练神经网络 使用Nvidia-smi工具
账户类 账户有余额,仍提示欠费 资源无法删除
CCE突发弹性引擎(对接CCI) bursting插件功能概览 快速使用 调度负载到CCI 资源配额 镜像 存储 网络 日志 监控 弹性伸缩 常见问题 父主题: 云原生bursting
弹性到CCI的工作负载支持多种华为云存储配置,用于满足客户多样化的存储需求。通过阅读本章用户可以: 了解弹性CCI的负载支持的存储类型。 了解弹性CCI的负载Hostpath类型的典型场景以及如何使用。 约束与限制 调度到CCI的实例的存储类型支持ConfigMap、Secret、EmptyDir、D
计费模式 计费模式概述 按需计费 资源套餐包
数据结构 本章描述API使用的公共参数。 请求数据结构(废弃) 响应数据结构(废弃) 数据结构
弹性伸缩 CCE容器实例弹性伸缩到CCI服务 VK支持的Annotation列表以及用法
Pod Pod 环境变量 启动命令 对容器进行初始化操作 Pod规格计算方式 生命周期管理 存活探针(liveness probe)