搜索_华为云

GPU插件检查异常处理 - 云容器引擎 CCE

您可以执行以下步骤确认GPU插件的升级目标版本与当前驱动配置。登录CCE控制台，前往“插件中心”处查看CCE AI套件（NVIDIA GPU）插件。单击该插件的“升级”按钮，查看插件目标版本及驱动版本。在测试环境验证安装升级目标版本的GPU插件，并配置当前GPU驱动后，测试创建节点是否正常使用。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
通过告警中心一键配置告警 - 云容器引擎 CCE

单击操作列“请求订阅”，向该终端发送订阅请求。若终端收到请求，请按照提示进行确认，确认完成后订阅终端状态将变为“已确认”。查看告警列表您可以在“告警列表”页面查看最近发送的历史记录。登录CCE控制台。在集群列表页面，单击目标集群名称进入详情页。在左侧导航栏选择“告警中心”，选择“告警列表”页签。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
通过动态存储卷使用本地持久卷 - 云容器引擎 CCE

事件查看PVC或PV的事件名称、事件类型、发生次数、Kubernetes事件、首次和最近发生的时间，便于定位问题。在左侧导航栏选择“存储”，在右侧选择“存储卷声明”或“存储卷”页签。单击目标实例操作列的“事件”，即可查看1小时内的事件（事件保存时间为1小时）。查看YAML

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 本地持久卷（Local PV）
加密云硬盘存储卷 - 云容器引擎 CCE

数可根据情况按需填写，详情请参见通过动态存储卷使用云硬盘。图1 加密存储卷单击“创建”。前往“存储卷声明”页面，查看加密云硬盘存储卷声明是否创建成功，并查看存储配置项是否显示已加密。图2 PVC加密在应用中使用加密PVC时，和使用普通PVC的方法一致。通过kubectl自动创建加密云硬盘

 帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 云硬盘存储（EVS）
在有状态负载中动态挂载本地持久卷 - 云容器引擎 CCE

事件查看PVC或PV的事件名称、事件类型、发生次数、Kubernetes事件、首次和最近发生的时间，便于定位问题。在左侧导航栏选择“存储”，在右侧选择“存储卷声明”或“存储卷”页签。单击目标实例操作列的“事件”，即可查看1小时内的事件（事件保存时间为1小时）。查看YAML

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 本地持久卷（Local PV）
通过动态存储卷使用文件存储 - 云容器引擎 CCE

事件查看PVC或PV的事件名称、事件类型、发生次数、Kubernetes事件、首次和最近发生的时间，便于定位问题。在左侧导航栏选择“存储”，在右侧选择“存储卷声明”或“存储卷”页签。单击目标实例操作列的“事件”，即可查看1小时内的事件（事件保存时间为1小时）。查看YAML

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 文件存储（SFS）
监控安全风险 - 云容器引擎 CCE

资源基础监控包含CPU/内存/磁盘等指标数据，您可以全面监控集群的健康状态和负荷程度，具体请参见监控概述。您可以在CCE控制台从集群、节点、工作负载等维度查看这些监控指标数据，也可以在AOM中查看。自定义指标 CCE支持采集应用程序中的自定义指标并上传到AOM，为您提供个性化的监控服务。您可以根据特定业务需求，扩

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 安全
删除子网后如何删除安全组规则？ - 云容器引擎 CCE

登录CCE控制台，单击集群列表中的集群名称。在左侧导航栏中选择“配置中心”，切换至“网络配置”页签。查看“容器网络配置”，以default-network（默认容器子网）为例，复制容器子网的“IPv4网段”。在左侧导航栏中选择“总览”，查看“网络信息”，单击“节点默认安全组”，跳转到安全组页面。选择“入方向

 帮助中心 > 云容器引擎 CCE > 常见问题 > 网络管理 > 网络指导
使用Prometheus监控多个集群 - 云容器引擎 CCE

集群等。如果在每个集群安装Prometheus监控集群里的业务各项指标的话，很大程度上提高了维护成本和资源成本，同时数据也不方便汇聚到一块查看，这时候可以通过部署一套Prometheus，对接监控多个集群的指标信息。方案架构将多个集群对接到同一个Prometheus监控系统，

帮助中心 > 云容器引擎 CCE > 最佳实践 > 监控
工作负载异常：GPU节点部署服务报错 - 云容器引擎 CCE

工作负载异常：GPU节点部署服务报错问题现象在CCE集群的GPU节点上部署服务出现如下问题：容器无法查看显存。部署了7个GPU服务，有2个是能正常访问的，其他启动时都有报错。 2个是能正常访问的CUDA版本分别是10.1和10.0 其他服务CUDA版本也在这2个范围内在

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
吊销用户的集群证书 - 云容器引擎 CCE

证书的通用名称 (CN - Common Name) 即所需 ID。方式二：如果您无法获取到此证书申请人下载的证书，您可以通过云审计服务查询删除用户 (deleteUser)、删除委托 (deleteAgency) 的事件，事件对应的资源 ID 分别是已删除用户、已删除委托账号的

 帮助中心 > 云容器引擎 CCE > API参考 > API > 集群管理
合理分配容器计算资源 - 云容器引擎 CCE

re-pod-container/memory-request-limit-2.yaml --namespace=mem-example 查看Pod的详细信息: kubectl get pod memory-demo-2 --namespace=mem-example 这时候，容

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 容器
节点池一直在扩容中但“操作记录”里为何没有创建节点的记录？ - 云容器引擎 CCE

问题现象节点池的状态一直处于“扩容中”，但是“操作记录”里面没有看到有对应创建节点的记录。原因排查：检查如下问题并修复：租户是否欠费。查看节点池配置的规格是否资源不足。租户的ECS或内存配额是否不足。如果一次创建节点太多，可能会出现租户的ECS容量校验不过的情况发生。解决方案：

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点池
CCE容器云存储PVC能否感知底层存储故障？ - 云容器引擎 CCE

PVC按照社区逻辑实现，PVC本身的定义是存储声明，与底层存储解耦，不负责感知底层存储细节，因此没有感知底层存储故障的能力。云监控服务CES 具备查看云服务监控指标的能力：云监控服务基于云服务自身的服务属性，已经内置了详细全面的监控指标。当用户在云平台上开通云服务后，系统会根据服务类型自

 帮助中心 > 云容器引擎 CCE > 常见问题 > 存储管理
Caffe分类范例 - 云容器引擎 CCE
Caffe分类范例 - 云容器引擎 CCE

BS存储盘的outputimg下，可以看到推理使用的图片。登录在集群中添加GPU节点添加的节点，执行docker logs {容器id}查看归类结果，可以看到结果：tabby cat。使用GPU 创建一个普通job，镜像输入第三方镜像bvlc/caffe:gpu，设置对应的容器规格。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Caffe
通过动态存储卷使用对象存储 - 云容器引擎 CCE

事件查看PVC或PV的事件名称、事件类型、发生次数、Kubernetes事件、首次和最近发生的时间，便于定位问题。在左侧导航栏选择“存储”，在右侧选择“存储卷声明”或“存储卷”页签。单击目标实例操作列的“事件”，即可查看1小时内的事件（事件保存时间为1小时）。查看YAML

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 对象存储（OBS）
告警中心概述 - 云容器引擎 CCE

CCE的云原生告警能力是由AOM服务提供的，支持指标和事件的告警。同时，CCE集群详情中增加了告警中心能力，能支持快速配置资源等常用告警和告警查看。图1 告警中心架构告警中心基于AOM服务的告警能力实现，提供集群内的告警快速检索、告警快速配置的能力。用户可以通过告警中心一键配置常用的告警规则。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 告警中心
节点规格说明 - 云容器引擎 CCE

实例家族。不同区域支持的节点规格（flavor）不同，且节点规格存在新增、售罄下线等情况，建议您在使用前登录CCE控制台，在创建节点界面查看您需要的节点规格是否支持。通用计算增强型通用计算增强型弹性云服务器是CPU独享型实例，实例间无CPU资源争抢，性能强劲稳定，搭载全新网络加速引擎，提供更高的网络性能。

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点
冻结或不可用的集群删除后如何清除残留资源 - 云容器引擎 CCE

务手动删除。弹性负载均衡资源前往弹性负载均衡控制台。通过集群使用的VPC ID进行过滤，得到该虚拟私有云下所有的弹性负载均衡实例。查看负载均衡实例下的监听器详情，描述中包含集群ID、Service ID等信息，说明该监听器由此集群创建。您可以根据上述信息将集群下残留的弹性负载均衡相关资源删除。

帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群删除
插件安装失败，提示The release name is already exist如何解决？ - 云容器引擎 CCE

若该插件为helm v2时创建，cce会在查看插件列表及插件详情等操作中自动将configmap中的v2 release转换至secret中的v3 release，原configmap中的v2 release不会删除。可执行以下命令查看插件相关的release的configmap列表。

帮助中心 > 云容器引擎 CCE > 常见问题 > 模板插件

总条数： 689

上一页
1
...
23
24
25
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU插件检查异常处理 - 云容器引擎 CCE

通过告警中心一键配置告警 - 云容器引擎 CCE

通过动态存储卷使用本地持久卷 - 云容器引擎 CCE

加密云硬盘存储卷 - 云容器引擎 CCE

在有状态负载中动态挂载本地持久卷 - 云容器引擎 CCE

通过动态存储卷使用文件存储 - 云容器引擎 CCE

监控安全风险 - 云容器引擎 CCE

删除子网后如何删除安全组规则？ - 云容器引擎 CCE

使用Prometheus监控多个集群 - 云容器引擎 CCE

工作负载异常：GPU节点部署服务报错 - 云容器引擎 CCE

吊销用户的集群证书 - 云容器引擎 CCE

合理分配容器计算资源 - 云容器引擎 CCE

节点池一直在扩容中但“操作记录”里为何没有创建节点的记录？ - 云容器引擎 CCE

CCE容器云存储PVC能否感知底层存储故障？ - 云容器引擎 CCE

Caffe分类范例 - 云容器引擎 CCE

通过动态存储卷使用对象存储 - 云容器引擎 CCE

告警中心概述 - 云容器引擎 CCE

节点规格说明 - 云容器引擎 CCE

冻结或不可用的集群删除后如何清除残留资源 - 云容器引擎 CCE

插件安装失败，提示The release name is already exist如何解决？ - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线