搜索_华为云

工作负载异常：GPU节点部署服务报错 - 云容器引擎 CCE

/nvidia-smi 若能正常返回GPU信息，说明设备可用，插件安装成功。如果驱动地址填写错误，需要将插件卸载后重新安装，并配置正确的地址。 nvidia驱动建议放在OBS桶里，并设置为公共读。

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
从Pod访问同一VPC网络的云服务 - 云容器引擎 CCE

须知： ping命令使用ICMP协议进行网络连通性测试。换言之，安全组规则至少需要开通相应的ICMP协议端口，ping命令才能访问成功。对于问题一，您需要添加相应的安全组规则，具体请参见添加安全组规则。对于问题二，您需要修改相应规则中的协议端口，具体请参见修改安全组规则。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 网络 > 从Pod访问集群外部网络
Kubernetes 1.25版本说明 - 云容器引擎 CCE

特性开启后可能应用所需的系统调用会被runtime限制，所以开启后应确保在测试环境调试，不会对应用造成影响。网络策略中的EndPort进入稳定阶段 Network Policy中的EndPort已进入稳定状态，该特性于1.21版本合入。

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 集群版本发布记录 > Kubernetes版本发布记录
选择合适的节点数据盘大小 - 云容器引擎 CCE

查看设备的磁盘和分区大小。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 集群
调度概述 - 云容器引擎 CCE
调度概述 - 云容器引擎 CCE

使用Kubernetes默认GPU调度 GPU虚拟化 GPU虚拟化能够动态对GPU设备显存与算力进行划分，单个GPU卡最多虚拟化成20个GPU虚拟设备。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度
kubelet配置 - 云容器引擎 CCE
kubelet配置 - 云容器引擎 CCE

restricted 策略：在这种模式下，kubelet 仅为Pod 分配NUMA 对齐的CPU 和设备资源。如果节点资源不存在符合NUMA对齐资源Pod将会被拒绝。

帮助中心 > 云容器引擎 CCE > 配置参考 > 节点
自定义部署Nginx Ingress Controller - 云容器引擎 CCE

测试验证创建一个工作负载，配置新部署的Nginx Ingress Controller为其提供网络访问。创建nginx工作负载。登录CCE控制台，进入集群，在左侧导航栏中选择“工作负载”，单击右上角“YAML创建”。填写以下内容，并单击“确定”。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 网络 > 通过模板包部署Nginx Ingress Controller
升级前须知 - 云容器引擎 CCE
升级前须知 - 云容器引擎 CCE

若为xfs则建议您在新版本集群预先部署应用，以测试应用与新版本集群是否兼容。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群
CCE集群弹性引擎 - 云容器引擎 CCE

(GPU/NPU)识别方法扩容节点数量超过集群规模时，使用集群支持的剩余节点数量进行扩容 1.23.0 1.23.44 v1.23 优化异构设备(GPU/NPU)识别方法扩容节点数量超过集群规模时，使用集群支持的剩余节点数量进行扩容 1.23.0 1.23.31 v1.23 修复

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 容器调度与弹性插件
配置节点故障检测策略 - 云容器引擎 CCE

表5 存储检查故障检查项功能说明磁盘只读 DiskReadonly 通过定期对节点系统盘、CCE数据盘（包含CRI逻辑盘与Kubelet逻辑盘）进行测试性写操作，检查关键磁盘的可用性检测路径： /mnt/paas/kubernetes/kubelet/ /var/lib/

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 节点运维
修改CCE集群配置 - 云容器引擎 CCE

说明：比例配置过大可能导致区域在规模故障场景下仍尝试执行大规模迁移动作，导致集群过载等风险。默认：0.55 取值范围为0-1 节点迁移速率 node-eviction-rate 当某区域健康时，在节点故障的情况下每秒删除 Pods的节点数。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 管理集群
工作负载异常：实例拉取镜像失败 - 云容器引擎 CCE

查看设备的磁盘和分区大小。

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
工作负载异常：实例调度失败 - 云容器引擎 CCE

查看设备的磁盘和分区大小。

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
登录节点 - 云容器引擎 CCE
登录节点 - 云容器引擎 CCE

表1 Linux云服务器登录方式一览是否绑定EIP 本地设备操作系统连接方法是 Windows 使用PuTTY、Xshell等远程登录工具。 SSH密码方式鉴权：SSH密码方式登录 SSH密钥方式鉴权：SSH密钥方式登录是 Linux 使用命令连接。

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点
容器网络 - 云容器引擎 CCE
容器网络 - 云容器引擎 CCE

图1 同一个节点中的Pod通信在同一节点上的Pod会通过Veth设备将一端连接到网桥，且它们的IP地址是通过网桥动态获取的，和网桥IP属于同一网段。此外，同一节点上的所有Pod默认路由都指向网桥，网桥会负责将所有非本地地址的流量进行转发。因此，同一节点上的Pod可以直接通信。

帮助中心 > 云容器引擎 CCE > Kubernetes基础知识 > Kubernetes网络
CCE节点故障检测 - 云容器引擎 CCE

权限说明 NPD插件为监控内核日志，需要读取宿主机/dev/kmsg设备，为此需要开启容器特权，详见privileged。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
手动更新GPU节点驱动版本 - 云容器引擎 CCE

stop kubelet kubelet-monit containerd containerd-monit 停止服务(docker运行时) systemctl stop kubelet kubelet-monit docker docker-monit 检查是否有程序正在使用GPU卡设备

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
采集NGINX Ingress访问日志 - 云容器引擎 CCE

数据分布：访问量PV分布（中国）、访问量PV分布（世界）、访问量UV分布（中国）、访问量UV分布（世界）、平均时延分布（中国）、平均时延分布（世界）、设备占比（终端）、设备占比（系统）。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 日志中心
通过kubectl对接多个集群 - 云容器引擎 CCE

cd /home mkdir -p $HOME/.kube mv -f kubeconfig-a.json $HOME/.kube/config 将集群B对应的kubeconfig-b.json文件移动至“$HOME/.kube/config-test”。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 集群
节点异常问题排查 - 云容器引擎 CCE

创建一个测试容器，示例如下，其中{node_ip}为该异常节点的IP。

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点

总条数： 165

上一页
1
...
5
6
7
8
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

工作负载异常：GPU节点部署服务报错 - 云容器引擎 CCE

从Pod访问同一VPC网络的云服务 - 云容器引擎 CCE

Kubernetes 1.25版本说明 - 云容器引擎 CCE

选择合适的节点数据盘大小 - 云容器引擎 CCE

调度概述 - 云容器引擎 CCE

kubelet配置 - 云容器引擎 CCE

自定义部署Nginx Ingress Controller - 云容器引擎 CCE

升级前须知 - 云容器引擎 CCE

CCE集群弹性引擎 - 云容器引擎 CCE

配置节点故障检测策略 - 云容器引擎 CCE

修改CCE集群配置 - 云容器引擎 CCE

工作负载异常：实例拉取镜像失败 - 云容器引擎 CCE

工作负载异常：实例调度失败 - 云容器引擎 CCE

登录节点 - 云容器引擎 CCE

容器网络 - 云容器引擎 CCE

CCE节点故障检测 - 云容器引擎 CCE

手动更新GPU节点驱动版本 - 云容器引擎 CCE

采集NGINX Ingress访问日志 - 云容器引擎 CCE

通过kubectl对接多个集群 - 云容器引擎 CCE

节点异常问题排查 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线