检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
节点--XGPU设备数量 节点--XGPU设备显存分配量 GPU卡--XGPU设备显存使用率 GPU卡--XGPU设备显存分配量 GPU卡--XGPU设备显存分配率 GPU卡--XGPU设备算力使用率 GPU卡--XGPU设备数量 GPU卡--调度策略 GPU卡--不健康的XGPU设备数量 容器显存分配量
任务和定时任务 任务概述 任务管理对应Kubernetes中的Job,分为普通任务和定时任务。 普通任务(Job)是Kubernetes用来控制批处理型任务的资源对象。批处理业务与长期伺服业务(Deployment、StatefulSet)的主要区别是批处理业务的运行有头有尾,而
见容忍策略。 配置完成后,单击“创建工作负载”。返回无状态工作负载列表查看工作负载状态。 在工作负载列表中,待工作负载状态为“运行中”,工作负载创建成功。 相关操作 通过集群控制台,您还可以执行表4中的操作。 表4 相关操作 操作 说明 YAML创建 单击右上角“YAML创建”,可使用已有的YAML创建工作负载。
节点亲和的规则只能影响Pod和节点之间的亲和,Kubernetes还支持Pod和Pod之间的亲和,例如将应用的前端和后端部署在一起,从而减少访问延迟。Pod亲和同样有requiredDuringSchedulingIgnoredDuringExecution和preferredDur
终端节点(Endpoint)即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点查询服务的终端节点。 UCS的终端节点如下表所示,请您根据业务需要选择对应区域的终端节点。 表1 UCS的终端节点 区域名称 区域 终端节点(Endpoint) 华北-北京四 cn-north-4
配置工作负载信息。在“容器配置>基本信息”中选择异构资源为GPU,然后选择资源使用模式: 整卡模式:整卡模式采用 Kubernetes 默认的调度方式,将 Pod 调度至满足 GPU 资源需求的节点上。 共享模式:共享模式可将多个 Pod 调度至同一张 GPU 卡上抢占式运行,负载资源使用率波动较大时能提高空闲 GPU
gpu-device-plugin 插件简介 gpu-device-plugin插件是支持在容器中使用GPU显卡的设备管理插件,集群中使用GPU节点时必须安装本插件。 约束与限制 下载的驱动必须是后缀为“.run”的文件。 仅支持Nvidia Tesla驱动,不支持GRID驱动。
配置工作负载信息。在“容器配置>基本信息”中,异构资源选择“NPU”,并设置NPU配额。 配置其余信息,完成后,单击“创建工作负载”。返回无状态工作负载列表查看工作负载状态。 在工作负载列表中,待工作负载状态为“运行中”,工作负载创建成功。 通过kubectl命令行创建NPU应用 本节以创建无状态工作负载(De
调用API获取项目ID 项目ID可以通过调用查询指定条件下的项目列表API获取。 获取项目ID的接口为“GET https://{Endpoint}/v3/projects”,其中{Endpoint}为IAM的终端节点,可以从地区和终端节点获取。接口的认证鉴权请参见认证鉴权。 响应示例如下
您也可以单击舰队名称进入舰队详情页,在“容器集群”页面单击右上角“添加集群”。 勾选一个或多个已有集群。一个集群只能加入一个舰队,因此列表中显示的集群均为未加入舰队的集群。 请确保所选择的集群符合表1中的约束条件,否则会出现集群添加成功,但是接入集群联邦失败的情况。如果出现这种情况,请参考集群加入联邦校验失败怎么办进行修复。
由于服务来自不同的服务提供商,不同类别的服务实例提供的展示内容可能存在差异,请根据页面提示进行操作。 当服务支持事件监控和日志查询功能时,在服务实例详情界面会出现一个“业务监控”页签和“日志”页签,具体操作请参见业务监控/日志。 当服务支持实例配置参数可视化修改功能时,在服务实例详情界面会出
端口配置:选择TCP协议,填写服务端口、容器端口,如8800、80。 部署集群:单击,依次添加ccecluster01和ccecluster02集群,负载均衡器选择共享型ELB实例,且必须和集群处于相同VPC中,如果列表中无可用ELB实例,单击“创建负载均衡器”前往ELB控制台进行创建。其他参数保持默认即可。
分页获取列表时,起始偏移量,默认为0 order_by 否 String 分页获取列表时,排序参数,支持 create_at 和 update_at order 否 String 分页获取列表时,排序方向,支持 desc 和 asc 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
获取权限策略列表 功能介绍 获取权限策略列表 URI GET /v1/permissions/rules 表1 Query参数 参数 是否必选 参数类型 描述 limit 否 Integer 分页获取列表时,页的大小,默认为-1 offset 否 Integer 分页获取列表时,起始偏移量,默认为0
Integer 分页获取列表时,页的大小,默认为-1 offset 否 Integer 分页获取列表时,起始偏移量,默认为0 order_by 否 String 分页获取列表时,排序参数,支持 create_at 和 update_at order 否 String 分页获取列表时,排序方向,支持
按需计费模式允许您根据实际业务需求灵活地调整服务使用,无需提前购买付费,灵活性高。一般适用于接入集群规模较小的业务场景。 表1列出了两种计费模式的区别。 表1 计费模式 计费模式 包年/包月 按需计费 付费方式 预付费 后付费 计费周期 按订单的购买周期计费。 按照华为云UCS服
错误码 如果操作请求在执行过程中出现异常导致未被处理,则会返回一条错误信息。错误信息中包括错误码和具体错误描述,表1列出了错误信息中的常见错误码及错误信息,您可根据描述处理相应的异常。 表1 错误码说明 错误码 状态码 错误信息 描述 UCS.00000001 400 Failed
拒绝白名单外的资源更新ServiceAccount。 策略实例示例 以下策略实例展示了策略定义生效的资源类型,pararmeters中定义了允许的组列表allowedGroups和允许的用户列表allowedUsers。 # IMPORTANT: Before deploying this policy, make
获取租户的CCE集群列表 功能介绍 获取当前租户的CCE集群列表 URI GET /v1/managedclusters 表1 Query参数 参数 是否必选 参数类型 描述 unregister 否 Boolean 是否注册到ucs 请求参数 表2 请求Header参数 参数 是否必选
请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于管理员创建IAM用户接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应请求消息头,响应同样