搜索_华为云

工作负载异常：实例驱逐异常（Evicted） - 云容器引擎 CCE

当达到软驱逐阈值时，允许Pod优雅终止的时间，即软驱逐宽限期，软驱逐信号与驱逐处理之间的时间差。默认为90秒。 eviction-max-pod-grace-period：最大驱逐pod宽限期，停止信号与kill之间的时间差。硬驱逐条件：硬驱逐机制则简单得多，一旦达到阈值，直接把Pod从本地驱逐。

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
通过节点池升级节点的GPU驱动版本 - 云容器引擎 CCE

通过节点池升级节点的GPU驱动版本如果您使用的CUDA库无法与当前的NVIDIA驱动版本匹配，您需要升级节点的驱动版本才可以正常使用GPU节点。建议您以节点池为粒度进行节点NVIDIA驱动版本的管理，创建应用时可调度到指定驱动版本的节点池，在升级驱动时，也可以根据节点池分批次控制升级。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
Gatekeeper - 云容器引擎 CCE
Gatekeeper - 云容器引擎 CCE

同时设置多条自定义亲和策略时，需要保证集群中存在同时满足所有亲和策略的节点，否则插件实例将无法运行。容忍策略容忍策略与节点的污点能力配合使用，允许（不强制）插件的 Deployment 实例调度到带有与之匹配的污点的节点上，也可用于控制插件的 Deployment 实例所在的节点被标记污点后插件的 Deployment

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 其他插件
Jenkins Master安装部署 - 云容器引擎 CCE

云存储类型可选择“云硬盘EVS”或“文件存储SFS”，若没有云存储可单击“创建存储卷声明”创建。如选择“云硬盘EVS”类型，要求EVS的可用区与节点可用区一致。图2 添加云存储给Jenkins容器添加权限，让Jenkins容器中可以执行相关命令。确认3中已开启“特权容器”开关。

帮助中心 > 云容器引擎 CCE > 最佳实践 > DevOps > 在CCE中安装部署Jenkins > 实施步骤
更新AddonInstance - 云容器引擎 CCE

"*****", "driver_init_image_version" : "2.1.30", "ecsEndpoint" : "*****", "everest_image_version" : "2.1.30",

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件管理
资源更新适配 - 云容器引擎 CCE

通过数据复制服务DRS将本地数据库迁移至云数据库RDS，则在迁移后需重新配置数据库的访问，请您根据实际情况进行配置。若云数据库RDS实例与CCE集群处于同一VPC下，则可通过内网地址访问，否则只能通过绑定EIP的方式进行公网访问。建议使用内网访问方式，安全性高，并且可实现RDS的较好性能。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 迁移 > 将K8s集群迁移到CCE > 实施步骤
将Prometheus监控数据上报至第三方监控平台 - 云容器引擎 CCE

如下：若您自建的Prometheus同样部署在K8s集群中，可进入Prometheus容器中查看。若您自建的Prometheus部署在虚拟机上，则可跳过本步骤。 kubectl exec -ti -n monitoring prometheus-server-0 -- sh 命令中变量可根据实际情况进行替换：

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
设置节点亲和调度（nodeAffinity） - 云容器引擎 CCE

参数说明示例权重仅支持在“尽量满足”策略中添加。权重的取值范围为1-100，调度器在进行调度时会将该权重视为一个附加的评分项，并将其与节点的其他优先级函数评分相加。最终，调度器会将Pod调度到总分最大的节点上。 - 标签名设置节点亲和性时，填写需要匹配的节点标签。该标签

 帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 调度工作负载
使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

Gauge MB 表示帧缓存剩余数，帧缓存一般被称为显存 DCGM_FI_DEV_FB_USED Gauge MB 表示帧缓存已使用数，该值与nvidia-smi命令中memory-usage的已使用值对应表3 温度及功率指标指标名称指标类型单位说明 DCGM_FI_DEV_GPU_TEMP

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
节点池亲和性调度 - 云容器引擎 CCE

}, { "name": "nodeCSIscheduling" }, {

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > 资源利用率优化调度
兼容Kubernetes默认GPU调度模式 - 云容器引擎 CCE

U显存隔离，可以和显存隔离模式的工作负载共用一张GPU卡，但不支持和算显隔离模式负载共用一张GPU卡。同时，还需遵循GPU虚拟化的其他约束与限制。未开启该兼容能力时，在工作负载中声明nvidia.com/gpu配额仅影响调度结果，并不会有显存隔离的限制。即虽然配置nvidia.com/gpu为0

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

是 String 插件的版本 driver_version 是 String 插件安装驱动时，插件里负责安装驱动的Pod的镜像tag，一般与device_version相同 obs_url 是 String 当从默认驱动地址中下载GPU驱动时，该值为GPU的驱动地址 swr_addr

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
通过静态存储卷使用已有极速文件存储 - 云容器引擎 CCE

tl连接到集群，详情请参见通过kubectl连接集群。您已经创建好一个状态可用的SFS Turbo，并且SFS Turbo与集群在同一个VPC内。约束与限制支持多个PV挂载同一个SFS或SFS Turbo，但有如下限制：多个不同的PVC/PV使用同一个底层SFS或SFS

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 极速文件存储（SFS Turbo）
监控中心概述 - 云容器引擎 CCE

nt的组件，用于采集指标、日志和应用性能数据。对于在ECS、BMS控制台直接购买的主机，您需手动安装ICAgent。对于集群节点，ICAgent会自动安装，您不用手动安装ICAgent。详情请参见安装ICAgent（华为云主机）。父主题：监控中心

 帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 监控中心
使用kubectl对接已有极速文件存储卷 - 云容器引擎 CCE

存储容量，单位Gi，必须和已有pv的storage大小保持一致。 volumeName PV的名称。极速文件存储所在VPC，子网必须与工作负载规划部署的ECS虚拟机的VPC保持一致，安全组开放入方向端口(111、445、2049、2051、20048)。创建PV。 kubectl create

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储管理-Flexvolume（已弃用） > 极速文件存储卷
在CCE集群中使用镜像服务的安全配置建议 - 云容器引擎 CCE

在CCE集群中使用镜像服务的安全配置建议容器镜像是防御外部攻击的第一道防线，对保障应用程序、系统乃至整个供应链的安全至关重要。不安全的镜像容易成为攻击者的突破口，导致容器逃逸到宿主机。一旦容器逃逸发生，攻击者便能访问宿主机的敏感数据，甚至利用宿主机作为跳板，进一步控制整个集群或

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 安全
NVIDIA GPU驱动漏洞公告（CVE-2021-1056） - 云容器引擎 CCE

GPU驱动程序中与设备隔离相关的安全漏洞。当容器以非特权模式启动，攻击者利用这个漏洞，通过在容器中创建特殊的字符设备文件后，能够获取宿主机上所有GPU设备的访问权限。关于漏洞的详细信息，请参见CVE-2021-1056。如果您的CCE集群中存在GPU（ECS）节点，并使用了CCE推荐的NVIDIA

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

通过PromQL语句查询Prometheus数据 PromQL是Prometheus Query Language的缩写，是一种用于查询和聚合时间序列数据的查询语言。Prometheus是一个开源的监控系统，用于收集和存储时间序列数据，每个时间序列都由一个唯一的标识符和一组时间戳

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
使用本地临时卷 - 云容器引擎 CCE

请参见通过kubectl连接集群。如需使用本地临时卷，您需要将一块节点数据盘导入本地临时卷存储池，详情请参见在存储池中导入临时卷。约束与限制本地临时卷仅在集群版本 >= v1.21.2-r0 时支持，且需要everest插件版本>=1.2.29。请勿在节点上手动删除对应的

 帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 临时存储卷（EmptyDir）
使用HPA+CA实现工作负载和节点联动弹性伸缩 - 云容器引擎 CCE

创建一个有1个节点的集群，节点规格为2U4G及以上，并在创建节点时为节点添加弹性公网IP，以便从外部访问。如创建节点时未绑定弹性公网IP，您也可以前往ECS控制台为该节点进行手动绑定。给集群安装插件。 autoscaler：节点伸缩插件。 metrics-server：是Kubernetes

帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩

总条数： 566

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

工作负载异常：实例驱逐异常（Evicted） - 云容器引擎 CCE

通过节点池升级节点的GPU驱动版本 - 云容器引擎 CCE

Gatekeeper - 云容器引擎 CCE

Jenkins Master安装部署 - 云容器引擎 CCE

更新AddonInstance - 云容器引擎 CCE

资源更新适配 - 云容器引擎 CCE

将Prometheus监控数据上报至第三方监控平台 - 云容器引擎 CCE

设置节点亲和调度（nodeAffinity） - 云容器引擎 CCE

使用dcgm-exporter监控GPU指标 - 云容器引擎 CCE

节点池亲和性调度 - 云容器引擎 CCE

兼容Kubernetes默认GPU调度模式 - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

通过静态存储卷使用已有极速文件存储 - 云容器引擎 CCE

监控中心概述 - 云容器引擎 CCE

使用kubectl对接已有极速文件存储卷 - 云容器引擎 CCE

在CCE集群中使用镜像服务的安全配置建议 - 云容器引擎 CCE

NVIDIA GPU驱动漏洞公告（CVE-2021-1056） - 云容器引擎 CCE

通过PromQL语句查询Prometheus数据 - 云容器引擎 CCE

使用本地临时卷 - 云容器引擎 CCE

使用HPA+CA实现工作负载和节点联动弹性伸缩 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线