检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用户需使用真实存在的KMS密钥,并且在集群生命周期结束前,禁止删除、禁用密钥等操作,防止集群功能异常(集群设置该密钥后不允许修改)。 集群查询API中,如果mode字段设置为Default,则该字段返回为空;若mode字段设置为KMS,则该字段为具体的密钥ID。 约束限制: 不涉及 取值范围: 不涉及 默认取值:
若能正常返回GPU信息,说明设备可用,插件安装成功。 如果驱动地址填写错误,需要将插件卸载后重新安装,并配置正确的地址。 nvidia驱动建议放在OBS桶里,并设置为公共读。 相关链接 GPU节点使用nvidia驱动启动容器排查思路 GPU插件安装 父主题: 工作负载异常问题排查
pathType: ImplementationSpecific ingressClassName: cce Ingress中还可以设置外部域名,这样您就可以通过域名来访问到ELB,进而访问到后端服务。 域名访问依赖于域名解析,需要您将域名解析指向ELB实例的IP地址,例如您可以使用云解析服务
Kubernetes安全漏洞公告(CVE-2022-3172) 漏洞详情 Kubernetes社区在 kube-apiserver 中发现了一个安全问题,该问题允许聚合 API Server将客户端流量重定向到任意 URL,这可能导致客户端执行意外操作以及将客户端的 API 服务器凭据转发给第三方。
具有以下特点: 强大的多维度数据模型: 时间序列数据通过metric名和键值对来区分。 所有的metrics都可以设置任意的多维标签。 数据模型更随意,不需要刻意设置为以点分隔的字符串。 可以对数据模型进行聚合,切割和切片操作。 支持双精度浮点类型,标签可以设为全unicode。
修改Volcano调度配置。 在nodeorder插件中,添加arguments参数,配置leastrequested.weight为0,即资源分配最少的节点优先级设置为0。 新增binpack插件,并指定GPU虚拟化自定义资源(volcano.sh/gpu-core.percentage和volcano
/etc/systemd/journald.conf 修改RuntimeMaxUse参数,建议值为100M。 若查看journald.conf文件时,文件中已设置RuntimeMaxUse值,可通过以下命令对参数值进行修改。 sed -i "s/RuntimeMaxUse=[0-9]*M/RuntimeMaxUse=100M/g"
存资源被普通工作负载占用的情况,导致GPU/NPU资源闲置。 解决方案 在使用GPU/NPU节点时,可以为其添加污点,并通过工作负载容忍度设置,避免非GPU/NPU工作负载调度到GPU/NPU节点上。 GPU/NPU工作负载:添加指定污点的容忍度,可以调度至GPU/NPU节点。
docker容器引擎的节点上运行,请使用containerd容器引擎。详细原因请参见组件说明。 设置插件实例的部署策略。 调度策略对于DaemonSet类型的插件实例不会生效。 设置多可用区部署或节点亲和策略时,需保证集群中存在满足调度策略的节点且拥有足够的资源,否则插件实例将无法运行。
不再显示此选项。 设置插件支持的“参数配置”。 自定义指标采集:以服务发现的形式自动采集应用的指标。开启后需要在目标应用添加相关配置,详情请参见使用云原生监控插件监控自定义指标。 采集周期:设置采集时间间隔周期。 数据保留期(选择“本地数据存储”时支持设置):监控数据保留的时长。
自定义调度策略:Pod可能根据自定义的亲和性和反亲和性策略进行调度,导致Pod在节点上分布不均匀。 节点污点和容忍度:节点存在某些污点,未设置容忍度的Pod无法调度到该节点上运行。 部分工作负载特性导致:工作负载可能具有特殊的分布约束,例如工作负载挂载某个可用区的云硬盘时只能调度到相同可用区的节点上。
参数解释 默认取值 大规格 其他规格 初始缓冲区大小(Buffer_Chunk_Size) 设置初始缓冲区大小以读取文件。 256k 128k 缓冲区最大限制值(Buffer_Max_Size) 设置每个受监视文件的缓冲区大小限制。当需要增加缓冲区时,此值用于限制内存缓冲区可以增加多少
化资源的无状态负载,并将GPU申请量设为大于集群现有GPU资源上限。例如:集群中有16GiB显存的资源,假设每个Pod占用1GiB显存,则设置Pod数量为17个,合计17GiB显存。 在等待一小段时间后,可以在节点池详情页面中,可观察到GPU节点的扩容。 父主题: GPU调度
用户需使用真实存在的KMS密钥,并且在集群生命周期结束前,禁止删除、禁用密钥等操作,防止集群功能异常(集群设置该密钥后不允许修改)。 集群查询API中,如果mode字段设置为Default,则该字段返回为空;若mode字段设置为KMS,则该字段为具体的密钥ID。 约束限制: 不涉及 取值范围: 不涉及 默认取值:
nginx-7f98958cdf to 2 升级 在实际应用中,升级是一个常见的场景,Deployment能够很方便地支撑应用升级。 Deployment可以设置不同的升级策略,有如下两种。 RollingUpdate:滚动升级,即逐步创建新Pod再删除旧Pod,为默认策略。 Recreate:替换
选择GPU节点驱动版本 使用GPU加速型云服务器时,需要安装正确的Nvidia基础设施软件,才可以使用GPU实现计算加速功能。在使用GPU前,您需要根据GPU型号,选择兼容配套软件包并安装。 本文将介绍如何选择GPU节点的驱动版本及配套的CUDA Toolkit。 如何选择GPU节点驱动版本
dule或NoExecute,此处必须设置为NoSchedule。 NoSchedule:一定不能被调度。 PreferNoSchedule:尽量不要调度。 NoExecute:不仅不会调度,还会驱逐Node上已有的Pod。 若需要重新设置污点时,可执行kubectl taint
uringExecution: # 尽量满足如下条件 - weight: 100 # 使用尽量满足策略时可设置优先级,取值为1-100,数值越大优先级越高 podAffinityTerm:
单击右上角“创建存储卷PV”,并设置以下参数。 存储卷类型:选择“文件存储”。 文件存储:选择数据迁移后的通用文件系统(SFS 3.0)存储卷。 PV名称:自定义PV名称。 访问模式:选择“ReadWriteMany”。 回收策略:请按需设置。 Delete:删除动作会将Per
例如,存储卷名称前缀设置为“test”,则实际创建的底层存储名称test-{uid}。 storage 是 PVC申请容量,单位为Gi和Mi,仅支持设置为整数。 若storage被设置为小数,系统将自动向上取整创建本地持久卷。例如storage值设置为10.1Gi时,系统将自动创建11Gi的本地持久卷。