检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
容器镜像签名验证插件版本发布记录 表1 swr-cosign插件版本记录 插件版本 支持的集群版本 更新特性 1.0.26 v1.23 v1.25 v1.27 v1.28 v1.29 v1.30 v1.31 支持v1.31集群 1.0.2 v1.23 v1.25 v1.27 支持v1
CCE密钥管理(对接 DEW)插件版本发布记录 表1 CCE密钥管理(对接 DEW)插件版本记录 插件版本 支持的集群版本 更新特性 1.1.57 v1.25 v1.27 v1.28 v1.29 v1.30 v1.31 支持CCE v1.31集群 1.1.33 v1.21 v1.23
Grafana插件版本发布记录 表1 Grafana插件版本记录 插件版本 支持的集群版本 更新特性 1.3.1 v1.17 v1.19 v1.21 v1.23 v1.25 v1.27 v1.28 v1.29 v1.30 v1.31 支持v1.31集群 1.3.0 v1.17 v1
CCE集群弹性引擎版本发布记录 表1 v1.31集群配套插件版本记录 插件版本 支持的集群版本 更新特性 社区版本 1.31.8 v1.31 支持CCE v1.31集群 1.31.1 表2 v1.30集群配套插件版本记录 插件版本 支持的集群版本 更新特性 社区版本 1.30.46
OpenKruise插件版本发布记录 表1 OpenKruise插件版本记录 插件版本 支持的集群版本 更新特性 社区版本 1.0.23 v1.25 v1.27 v1.28 v1.29 v1.30 v1.31 支持CCE v1.31集群 1.5.4 1.0.12 v1.23 v1
Kubernetes Metrics Server插件版本发布记录 表1 Kubernetes Metrics Server插件版本记录 插件版本 支持的集群版本 更新特性 社区版本 1.3.90 v1.25 v1.27 v1.28 v1.29 v1.30 v1.31 支持CCE
持久化存储 Volume PV、PVC和StorageClass
认证与授权 ServiceAccount RBAC
Volume插件将不再使用,并在将来的版本中删除。 apiextensions.k8s.io/v1beta1已弃用,推荐使用apiextensions.k8s.io/v1。 apiregistration.k8s.io/v1beta1已弃用,推荐使用apiregistration.k8s.io/v1。
cce-gpu ... 创建高优、低优priorityClass资源。 cat <<EOF | kubectl apply -f - apiVersion: scheduling.k8s.io/v1 description: Used for high priority pods
er API HorizontalPodAutoscaler的autoscaling/v2beta2 API版本将不再在1.26版本中提供,详情请参见各发行版本中移除的API。 用户应迁移至autoscaling/v2版本的API。 移除v1beta1版本的流量控制API组 在Kubernetes
er API HorizontalPodAutoscaler的autoscaling/v2beta2 API版本将不再在1.26版本中提供,详情请参见各发行版本中移除的API。 用户应迁移至autoscaling/v2版本的API。 移除v1beta1版本的流量控制API组 在Kubernetes
theus的集群,在左侧导航栏中选择“服务”。 单击右上角“YAML创建”,创建一个公网LoadBalancer类型的Service。 apiVersion: v1 kind: Service metadata: name: prom-lb #服务名称,可自定义 namespace:
2为默认模式表示当前卡还没被用于XGPU设备分配 xgpu_device_health Gauge XGPU设备的健康情况。当前虚拟化域侧并没有提供特定的接口来检查XGPU的健康情况,所以根据XGPU设备所在物理GPU设备的健康情况反推。0表示XGPU设备为健康状态,1表示为非健康状态。 父主题:
根据基础资源指标进行弹性伸缩:需将Prometheus注册为Metrics API的服务,详见通过Metrics API提供基础资源指标。 根据自定义指标进行弹性伸缩:需要将自定义指标聚合到Kubernetes API Server,详情请参见使用自定义指标创建HPA策略。 Promet
Training (TFJob)获取更详细的信息。 创建MNIST示例 部署TFJob资源以开始训练。 创建tf-mnist.yaml文件,示例如下: apiVersion: "kubeflow.org/v1" kind: TFJob metadata: name: tfjob-simple
请显存,即调用CUDA API cudaMallocManaged(),更多信息,请参见NVIDIA官方文档。请使用其他方式申请显存,例如调用cudaMalloc()等。 受GPU虚拟化技术的限制,容器内应用程序初始化时,通过nvidia-smi监测工具监测到的实时算力可能超过容器可用的算力上限。
状态信息 执行状态 参数名 取值范围 默认值 是否允许修改 作用范围 status 无 无 允许 - 最新事件 参数名 取值范围 默认值 是否允许修改 作用范围 status_description 无 无 允许 - 创建时间 参数名 取值范围 默认值 是否允许修改 作用范围 create_at
定时任务 CronJobSpec
Pod PodTemplate Container配置 容器resource资源