搜索_华为云

GPU故障处理 - 云容器引擎 CCE
GPU故障处理 - 云容器引擎 CCE

Device=%s, UUID=%s, SN=%s failed to get power state. GPU设备存在功率查询异常不隔离故障定位步骤 NVML显存重映射行数查询异常 GPU驱动或GPU设备存在异常，请根据GPU设备所在的节点类型（ECS或BMS），联系对应的客服进行处理。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
修改最大文件句柄数 - 云容器引擎 CCE

修改节点系统级最大文件句柄数登录节点，查看/etc/sysctl.conf文件。 cat /etc/sysctl.conf 修改fs.file-max参数，fs.file-max=1048576为内核参数名称及建议取值。若查看sysctl.conf文件时，文件中已设置fs

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 节点运维 > 节点系统参数优化
thinpool磁盘空间耗尽导致容器或节点异常时，如何解决？ - 云容器引擎 CCE

步云服务器”。登录目标节点。使用lsblk命令查看节点块设备信息。这里存在两种情况，根据容器存储Rootfs而不同。 Overlayfs：没有单独划分thinpool，在dockersys空间下统一存储镜像相关数据。查看设备的磁盘和分区大小。 # lsblk NAME

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
通过动态存储卷使用本地持久卷 - 云容器引擎 CCE

事件查看PVC或PV的事件名称、事件类型、发生次数、Kubernetes事件、首次和最近发生的时间，便于定位问题。在左侧导航栏选择“存储”，在右侧选择“存储卷声明”或“存储卷”页签。单击目标实例操作列的“事件”，即可查看1小时内的事件（事件保存时间为1小时）。查看YAML

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 本地持久卷（Local PV）
加密云硬盘存储卷 - 云容器引擎 CCE

数可根据情况按需填写，详情请参见通过动态存储卷使用云硬盘。图1 加密存储卷单击“创建”。前往“存储卷声明”页面，查看加密云硬盘存储卷声明是否创建成功，并查看存储配置项是否显示已加密。图2 PVC加密在应用中使用加密PVC时，和使用普通PVC的方法一致。通过kubectl自动创建加密云硬盘

 帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 云硬盘存储（EVS）
HTTPS类型负载均衡证书一致性检查异常处理 - 云容器引擎 CCE

证书管理”界面找到该证书，在证书描述字段中找到对应的secret_id。图1 查询证书该secret_id即为集群中对应Secret的metadata.uid字段，可以根据该uid查询集群中Secret的名称。您可以通过以下kubectl命令进行查询，其中<secret_id>请自行替换。 kubectl

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
在有状态负载中动态挂载本地持久卷 - 云容器引擎 CCE

事件查看PVC或PV的事件名称、事件类型、发生次数、Kubernetes事件、首次和最近发生的时间，便于定位问题。在左侧导航栏选择“存储”，在右侧选择“存储卷声明”或“存储卷”页签。单击目标实例操作列的“事件”，即可查看1小时内的事件（事件保存时间为1小时）。查看YAML

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 本地持久卷（Local PV）
监控安全风险 - 云容器引擎 CCE

资源基础监控包含CPU/内存/磁盘等指标数据，您可以全面监控集群的健康状态和负荷程度，具体请参见监控概述。您可以在CCE控制台从集群、节点、工作负载等维度查看这些监控指标数据，也可以在AOM中查看。自定义指标 CCE支持采集应用程序中的自定义指标并上传到AOM，为您提供个性化的监控服务。您可以根据特定业务需求，扩

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 安全
如何设置容器内的DNS策略？ - 云容器引擎 CCE

作节点继承。如果将dnsPolicy设置为“ClusterFirst”，则DNS查询将发送到kube-dns服务。对于以配置的集群域后缀为根的域的查询将由kube-dns服务应答。所有其他查询（例如，www.kubernetes.io）将被转发到从节点继承的上游名称服务器。在

 帮助中心 > 云容器引擎 CCE > 常见问题 > 域名DNS
通过动态存储卷使用文件存储 - 云容器引擎 CCE

事件查看PVC或PV的事件名称、事件类型、发生次数、Kubernetes事件、首次和最近发生的时间，便于定位问题。在左侧导航栏选择“存储”，在右侧选择“存储卷声明”或“存储卷”页签。单击目标实例操作列的“事件”，即可查看1小时内的事件（事件保存时间为1小时）。查看YAML

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 文件存储（SFS）
负载感知调度 - 云容器引擎 CCE

--raw=/apis/custom.metrics.k8s.io/v1beta1 执行以下命令，查询集群内节点信息。 kubectl get nodes 然后任选一个节点执行以下命令，其中xxxx替换为查询到的node_name，如果需要查询所有节点资源信息，可以使用*代替xxxx： kubectl get --raw=/apis/custom

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > 资源利用率优化调度
GPU插件检查异常处理 - 云容器引擎 CCE

您可以执行以下步骤确认GPU插件的升级目标版本与当前驱动配置。登录CCE控制台，前往“插件中心”处查看CCE AI套件（NVIDIA GPU）插件。单击该插件的“升级”按钮，查看插件目标版本及驱动版本。在测试环境验证安装升级目标版本的GPU插件，并配置当前GPU驱动后，测试创建节点是否正常使用。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点池一直在扩容中但“操作记录”里为何没有创建节点的记录？ - 云容器引擎 CCE

问题现象节点池的状态一直处于“扩容中”，但是“操作记录”里面没有看到有对应创建节点的记录。原因排查：检查如下问题并修复：租户是否欠费。查看节点池配置的规格是否资源不足。租户的ECS或内存配额是否不足。如果一次创建节点太多，可能会出现租户的ECS容量校验不过的情况发生。解决方案：

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点池
CCE容器云存储PVC能否感知底层存储故障？ - 云容器引擎 CCE

PVC按照社区逻辑实现，PVC本身的定义是存储声明，与底层存储解耦，不负责感知底层存储细节，因此没有感知底层存储故障的能力。云监控服务CES 具备查看云服务监控指标的能力：云监控服务基于云服务自身的服务属性，已经内置了详细全面的监控指标。当用户在云平台上开通云服务后，系统会根据服务类型自

 帮助中心 > 云容器引擎 CCE > 常见问题 > 存储管理
Caffe分类范例 - 云容器引擎 CCE
Caffe分类范例 - 云容器引擎 CCE

BS存储盘的outputimg下，可以看到推理使用的图片。登录在集群中添加GPU节点添加的节点，执行docker logs {容器id}查看归类结果，可以看到结果：tabby cat。使用GPU 创建一个普通job，镜像输入第三方镜像bvlc/caffe:gpu，设置对应的容器规格。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Caffe
容器异常退出状态码 - 云容器引擎 CCE

Code）来报告容器异常的原因。本文将介绍如何通过事件中打印的Exit Code进一步定位容器异常的根本原因。查看容器异常退出状态码您可使用kubectl连接集群，并通过以下命令查询Pod详细状态： kubectl describe pod {pod name} 在返回结果中的Exit

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
告警中心概述 - 云容器引擎 CCE

CCE的云原生告警能力是由AOM服务提供的，支持指标和事件的告警。同时，CCE集群详情中增加了告警中心能力，能支持快速配置资源等常用告警和告警查看。图1 告警中心架构告警中心基于AOM服务的告警能力实现，提供集群内的告警快速检索、告警快速配置的能力。用户可以通过告警中心一键配置常用的告警规则。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
包年/包月转按需 - 云容器引擎 CCE

包年/包月转按需计费需要在“费用中心 > 续费管理”页面操作，只有订单状态是“使用中”的资源才能执行包年/包月转按需。操作步骤进入续费管理页面。自定义查询条件。可在“到期转按需项”页签查询已经设置到期转按需的资源。可对“手动续费项”、“自动续费项”、“到期不续费项”页签的资源设置到期转按需的操作。图1 续费管理

 帮助中心 > 云容器引擎 CCE > 计费说明 > 变更计费模式
工作负载异常：GPU节点部署服务报错 - 云容器引擎 CCE

工作负载异常：GPU节点部署服务报错问题现象在CCE集群的GPU节点上部署服务出现如下问题：容器无法查看显存。部署了7个GPU服务，有2个是能正常访问的，其他启动时都有报错。 2个是能正常访问的CUDA版本分别是10.1和10.0 其他服务CUDA版本也在这2个范围内在

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
配额管理 - 云容器引擎 CCE
配额管理 - 云容器引擎 CCE

配额管理查询CCE服务下的资源配额父主题： API

帮助中心 > 云容器引擎 CCE > API参考 > API

总条数： 863

上一页
1
...
32
33
34
...
44
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU故障处理 - 云容器引擎 CCE

修改最大文件句柄数 - 云容器引擎 CCE

thinpool磁盘空间耗尽导致容器或节点异常时，如何解决？ - 云容器引擎 CCE

通过动态存储卷使用本地持久卷 - 云容器引擎 CCE

加密云硬盘存储卷 - 云容器引擎 CCE

HTTPS类型负载均衡证书一致性检查异常处理 - 云容器引擎 CCE

在有状态负载中动态挂载本地持久卷 - 云容器引擎 CCE

监控安全风险 - 云容器引擎 CCE

如何设置容器内的DNS策略？ - 云容器引擎 CCE

通过动态存储卷使用文件存储 - 云容器引擎 CCE

负载感知调度 - 云容器引擎 CCE

GPU插件检查异常处理 - 云容器引擎 CCE

节点池一直在扩容中但“操作记录”里为何没有创建节点的记录？ - 云容器引擎 CCE

CCE容器云存储PVC能否感知底层存储故障？ - 云容器引擎 CCE

Caffe分类范例 - 云容器引擎 CCE

容器异常退出状态码 - 云容器引擎 CCE

告警中心概述 - 云容器引擎 CCE

包年/包月转按需 - 云容器引擎 CCE

工作负载异常：GPU节点部署服务报错 - 云容器引擎 CCE

配额管理 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线