检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
设置xGPU配额 本文主要为您介绍GPU虚拟化的使用,其他参数详情请参见工作负载。 其余信息都配置完成后,单击“创建”。 工作负载创建成功后,您可以尝试验证GPU虚拟化的隔离能力。 登录容器查看容器被分配显存总量。 kubectl exec -it gpu-app -- nvidia-smi 预期输出:
timeo=600 - hard PV创建后,可以创建PVC关联PV,然后在工作负载的容器中挂载,具体操作步骤请参见通过静态存储卷使用已有文件存储。 验证挂载参数是否生效。 本例中将PVC挂载至使用nginx:latest镜像的工作负载,并通过mount -l命令查看挂载参数是否生效。 查看
kubectl apply -f web-evs.yaml 工作负载创建成功后,容器挂载目录下的数据将会持久化保持,您可以参考验证数据持久化中的步骤进行验证。 验证数据持久化 查看部署的应用及云硬盘文件。 执行以下命令,查看已创建的Pod。 kubectl get pod | grep
v1.27 v1.28 v1.29 修复部分问题 1.9.6 2.6.5 v1.25 v1.27 v1.28 v1.29 支持在启动命令中关闭指标采集 1.9.6 2.6.4 v1.25 v1.27 v1.28 v1.29 适配CCE v1.29集群 1.9.6 表3 NGINX
且监控数据需要满足Prometheus的规范。 部署应用并转换指标 在集群中使用该应用镜像部署工作负载,将自动上报自定义监控指标。 配置验证 前往AOM查看自定义指标是否采集成功。 约束与限制 ICAgent兼容Prometheus的监控数据规范,Pod提供的自定义指标必须满足
设置节点亲和性时,填写节点标签对应的标签值。 true 调度策略添加完成后,单击“创建工作负载”。 验证Pod全部运行在目标节点上。 在集群控制台左侧导航栏中选择“工作负载”。 单击工作负载名称,进入详情页面,查看实例列表,验证Pod全部运行在目标节点上,即节点包含gpu=true标签。 工作负载节点亲
- test-gatekeeper parameters: labels: ["test-label"] EOF 验证约束的效果。 执行以下命令,在test-gatekeeper命名空间下创建一个不包含test-label标签的Pod。 kubectl -n
1的优先级高于Job 2。 图1 DRF调度示意图 配置公平调度策略 安装Volcano后,您可通过“配置中心 > 调度配置”选择开启或关闭DRF调度能力,默认开启。 登录CCE控制台。 单击集群名称进入集群,在左侧选择“配置中心”,在右侧选择“调度配置”页签。 在“AI任务性
ring名空间下,默认不识别任何其他命名空间的ServiceMonitor和PodMonitor。 只支持无本地存储的模式。 开启后不支持关闭,可通过插件卸载安装的方式切换为正常模式。 暂不支持成本优化。 暂不支持在AOM页面进行指标废弃。 暂不支持在AOM页面进行Service
foo.bar.com" | sudo tee -a /etc/hosts 预期输出: 10.3.xx.xx foo.bar.com 结果验证。 客户端不传证书访问 curl --cacert ./ca.crt https://foo.bar.com 预期输出: <html> <head><title>400
量的云盘,便于快速扩展。 创建StatefulSet应用。 kubectl create -f statefulset.yaml 配置验证 验证动态创建的存储卷(PV)是否跟随Pod实例部署在不同可用区。 通过以下命令查看新建的PV。 kubectl get pv 回显如下,其中前3条为随Pod实例动态创建的PV。
kubectl config use-context default \ --kubeconfig=dev.conf 利用以下命令行进行验证。 # kubectl --kubeconfig=dev.conf get po Error from server (Forbidden):
}。详情请参见bind。 cache 默认配置 启用DNS缓存。详情请参见cache。 插件版本>=1.25.10时,支持关闭servfail缓存。如需关闭servfail缓存,请将configBlock设置为"servfail 0";否则servfail缓存的单位为s,不可省略。
sh/preemptable: "true" 表示作业是否可抢占。开启后,认为该作业可以被抢占。 取值范围: true:开启抢占。(默认为开启状态) false:关闭抢占。 可通过查询Pod详情查看Pod是否由Volcano调度,以及被分配的队列: 使用以下命令查询Pod详情并获取scheduling.k8s
服务,无需独立配置。您可以手动配置日志采集路径,详情请参见通过ICAgent采集容器日志(不推荐)。 如需要关闭当前负载的标准输出,您可在标签与注解中添加键为kubernetes.AOM.log.stdout,值为[]的注解,即可关闭当前负载下全部容器的标准输出。该注解的使用方法请参见表1。 镜像访问凭证:用于
cilium-agent预计占用内存80MiB,每增加一个Pod,cilium-agent内存消耗预计额外增加10KiB。集群创建后不支持关闭且只能使用Huawei Cloud EulerOS 2.0操作系统,且不支持云原生混部的出口网络带宽保障能力,请详细了解DataPlane
您可通过在集群中新建Pod并通过ClusterIP访问Service的方式进行检查,如您的服务为NodePort类型,也可通过EIP:Port使用互联网访问服务来验证。 通过kubectl连接集群,查询集群内服务。 # kubectl get svc NAME TYPE CLUSTER-IP
cache 30 forward . 10.0.0.190 } CoreDNS其他配置详解,请参见自定义 DNS 服务。 配置验证 创建一个Pod访问IDC的域名,如下所示,同样能够ping通,说明能够解析。 web-terminal-568c6566df-c9jhl:~#
a挂载到GPU容器的/usr/lib/nvidia路径上 disable_nvidia_gsp 否 Bool 默认值:true true:关闭GPU的GSP firmware driver_mount_paths 否 String 自动挂载到GPU容器里的路径 默认值:"bin,lib64"
原版本,20%的流量走灰度版本。 基于请求内容:根据请求内容配置规则,只有请求内容中满足特定条件的流量会切分到灰度版本上。例如只有在Windows操作系统上的用户可以访问灰度版本。 以“基于流量比例”为例,且v3版本流量配比为20%。更多策略内容请参见为服务添加灰度版本。 图7 灰度策略