检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
容器设置 容器基本信息 设置容器规格 设置容器生命周期 设置容器健康检查 设置环境变量 配置工作负载升级策略 配置调度策略(亲和与反亲和) 配置调度与差异化 父主题: 工作负载
容器存储 存储概述 挂载本地存储 挂载存储卷 创建存储卷声明 父主题: 集群联邦
管理本地集群 本地集群KubeConfig文件 本地集群配置文件 管理本地集群节点 管理本地集群网络 升级本地集群 注销本地集群 使用ucs-ctl命令行工具管理本地集群 GPU调度 NPU调度 备份与恢复 父主题: 本地集群
多集群Service MCS概述 使用MCS 南北向MCS 父主题: 集群联邦
配置MCI自动切流 自动切流概述 配置无条件触发自动切流 配置条件触发自动切流 父主题: 多集群Ingress
服务管理 命名空间 网格服务 服务版本 服务健康 关联服务 父主题: 服务网格
灰度发布 概述 创建灰度发布 更新灰度发布 父主题: 服务网格
流量治理 概述 服务路由 流量策略 父主题: 服务网格
服务路由 服务路由概述 创建服务路由 更新服务路由 服务路由协议 重试 重写 请求超时 流量镜像 CORS 头域控制 故障注入 父主题: 流量治理
服务路由协议 在HTTP、TLS和TCP这三个字段上分别定义了应用于HTTP、TLS和TCP三种协议的路由规则。 从规则构成上都是先定义一组匹配条件,然后对满足条件的流量执行对应的操作。 协议服务路由类型至少开启一种。同时开启的路由类型需添加一个无匹配条件的路由,作为默认路由,以免出现访问异常。
fluentbit_output_dropped_records_total 用于记录输出插件丢弃的记录数量 Counter fluentbit_output_errors_total 用于监控 Fluent Bit 的输出错误数量 Counter fluentbit_output_proc_bytes_total
修复因为精度不够引发的训练任务OOM的问题 修复CCE1.15以上版本GPU调度的问题,暂不支持任务分发时的CCE版本滚动升级 修复特定场景下队列状态不明的问题 修复特定场景下作业挂载PVC panic的问题 修复GPU作业无法配置小数的问题 添加ioaware插件 添加ring
##需要使用的npu卡数量 limits: cpu: 250m memory: 512Mi huawei.com/ascend-1980: '1' ##需要使用的npu卡数量
资源统计涵盖了该舰队下CPU用量Top5集群、内存用量Top5集群、节点数量Top5集群以及Pod数量Top5集群等参数统计。其中单击内存/CPU右上角“可分配量”可查看其剩余可分配用量,单击节点/Pod数量右上角“异常数”可查看其出现异常的集群数量。 资源盘点 资源盘点可统计该舰队下所有集群的版本、
在购买集群或集群内资源后,如果发现当前计费模式无法满足业务需求,您还可以变更计费模式。 计费项 华为云UCS的计费项由UCS管理服务费用组成,根据集群vCPU的数量按小时计费,如需查看每个用户集群的vCPU容量(计入UCS费用的部分),可运行以下命令: kubectl get nodes -o jsonpath='{range
卡最多虚拟化成20个GPU虚拟设备。相对于静态分配来说,虚拟化的方案更加灵活,最大程度保证业务稳定的前提下,可以完全由用户定义使用的GPU数量,提高GPU利用率。 GPU虚拟化功能优势如下: 灵活:精细配置GPU算力占比及显存大小,算力分配粒度为5%GPU,显存分配粒度达MB级别。
步骤一:云日志服务VPC终端节点授权 在导航栏单击“工单>新建工单”。 在“我遇到的问题所属产品/服务”的输入框中输入LTS,单击“搜索” 问题类型选择“其他问题”,新建工单。 输入问题描述,选择联系方式,并提交。 问题描述内容建议:云日志服务VPC终端节点授权,{账号ID}。如:云日志服务VPC终端节点权限开通。
nvidia.com/gpu 否 通过 nvidia.com/gpu 指定申请GPU的数量,支持申请设置为小于1的数量,比如 nvidia.com/gpu: 0.5,这样可以多个Pod共享使用GPU。GPU数量小于1时,不支持跨GPU分配,如0.5 GPU只会分配到一张卡上。 指定nvidia
停止访问负载,观察工作负载自动缩容过程。 查看FederatedHPA策略,可以看到从13m开始CPU使用率为21%,18m时Pod数量缩为3个,到23m时Pod数量缩为1个。 kubectl get federatedhpa hpa-example-hpa --watch NAME
minReplicas 是 String 触发策略时,工作负载内Pod数量所能缩容到的最小值,请输入1-299之间的正整数。 maxReplicas 是 String 触发策略时,工作负载内Pod数量所能扩容到的最大值,请输入1-1500之间的正整数,且输入值需大于实例范围最小值。