检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修复安装驱动的问题 2.5.4 v1.28 支持v1.28集群 2.1.24 v1.21 v1.23 v1.25 v1.27 GPU基础指标中增加XGPU数据 2.1.14 v1.21 v1.23 v1.25 v1.27 修复nvidia-container-toolkit CVE-2024-0132容器逃逸漏洞
190'。 单击“确定”完成配置更新。 在左侧导航栏中选择“配置项与密钥”,在“kube-system”命名空间下,查看coredns配置项数据,确认是否更新成功。 对应Corefile内容如下: .:5353 { bind {$POD_IP} cache 30
lass的动态创建PV能力。动态挂载可以为每一个Pod关联一个独有的PVC及PV,当Pod被重新调度后,仍然能够根据该PVC名称挂载原有的数据。 仅云硬盘存储、本地持久卷、专属存储支持 仅有状态工作负载支持 PV回收策略 PV回收策略用于指定删除PVC时,底层卷的回收策略,支持设定Delete、Retain回收策略。
apiVersion String API版本,固定值“v3”,该值不可修改。 metadata JobMetadata object 任务元数据。 spec JobSpec object 任务详细参数。 status JobStatus object 任务状态信息。 表4 JobSpec
String 资源类型 apiVersion 否 String API版本 metadata 否 metadata object 分区的元数据信息 spec 否 spec object 分区的配置信息 表3 metadata 参数 是否必选 参数类型 描述 name 否 String
设置存活/就绪探针:在容器配置中选择“健康检查”,开启存活探针和就绪探针。示例中均为TCP端口检查,请根据应用实际情况进行设置。检测周期、延时时间、超时时间等数据需要合理设置,部分应用启动时间较长,如果设置的时间过短,会导致Pod反复重启。 本示例中配置就绪探针延迟探测时间为20s,用于控制工作负载批量滚动的时间间隔。
String 资源类型 apiVersion 否 String API版本 metadata 否 metadata object 分区的元数据信息 spec 否 spec object 分区的配置信息 表3 metadata 参数 是否必选 参数类型 描述 name 否 String
请求体最大值 proxy-body-size 指定NGINX代理发送到后端服务器时,可以接受的请求体的最大值。这个值限制了上传文件或者提交大数据表单的大小。如果请求体超过了这个值,将返回413 (Payload Too Large) 错误。 20m 允许后端返回Server标头信息
DCGM指标观测”,开启后将在GPU节点上同时部署dcgm-exporter组件。 启用dcgm-exporter组件后,采集的GPU监控数据如需上报AOM服务,请安装云原生监控插件并开启上报至AOM服务开关,同时前往“配置中心 > 监控运维配置”页开启dcgm-exporter
缺省值:PersistentVolume metadata 是 PersistentVolumeMetadata object PersistentVolume的元数据信息 spec 是 PersistentVolumeSpec object PersistentVolume的规格信息 status 否
解析能力选择“小规格”、“中规格”或“大规格”,系统会根据不同的预置规格配置插件的实例数及资源配额,具体配置值请以控制台显示为准。 “小规格”最大支持50节点、500PVC规模集群;“中规格”最大支持200节点、2000PVC规模集群;“大规格”最大支持1000节点、10000PVC规模集群。
具体使用场景和示例请参见为ELB Ingress配置gzip数据压缩。 表12 开启gzip压缩注解 参数 类型 描述 支持的集群版本 kubernetes.io/elb.gzip-enabled String LoadBalancer支持开启数据压缩,通过数据压缩可缩小传输文件大小,提升文件传输效率减少带宽消耗。
StorageClass的名称,对象存储为csi-obs volumeName: testing-abc # PV的名称 创建工作负载,并在容器配置中的数据存储选项中选择存储卷声明PVC,添加上述创建的PVC,如果工作负载能够正常创建成功,则说明可以跨区域使用OBS桶。 apiVersion:
表5 污点容忍配置 node_match_expressions 否 Array of 表6 插件实例亲和性配置 表4 resources字段数据结构说明 参数 是否必选 参数类型 描述 limitsCpu 是 String CPU大小限制,单位:m。 limitsMem 是 String
value.split("\\s+")).groupByKey(value => value).count().count() 下述命令定义了各种数据来源: var alluxio = spark.read.textFile("alluxio://alluxio-master:19998/sample-1g")
在默认情况下,镜像启动时会运行默认命令,如果想运行特定命令或重写镜像默认值,需要进行相应设置。 Docker的镜像拥有存储镜像信息的相关元数据,如果不设置生命周期命令和参数,容器运行时将运行镜像制作时提供的默认的命令和参数,Docker将这两个字段定义为ENTRYPOINT和 CMD。
nginx-7c4c5cc6b5-vpncx -- /bin/sh 访问ELB地址。 curl **.**.**.** 稍微等待一段时间,查看ELB控制台的监控数据。 如果ELB出现新建访问连接,说明本次访问经过ELB转发,与预期一致。 父主题: 负载均衡(LoadBalancer)
确保在多种类型资源共存的环境下,尽可能满足分配的公平原则。 配置建议: DRF调度算法优先考虑集群中业务的吞吐量,适用单次AI训练、单次大数据计算以及查询等批处理小业务场景。 组调度 将一组Pod看做一个整体进行资源分配。观察Job下的Pod已调度数量是否满足了最小运行数量,当J
metadata.labels.app 其中LABELS为显示的列标题,可以自己设置,“.metadata.labels.app”为查询的数据需要按照之前的YAML或JSON获取。 create create命令用于根据文件或输入创建集群资源。 如果已经定义了相应资源的YAML或
参数 参数类型 描述 server String 服务器地址。 certificate-authority-data String 证书授权数据。 insecure-skip-tls-verify Boolean 不校验服务端证书,在 cluster 类型为 externalCluster