搜索_华为云

CCE节点故障检测 - 云容器引擎 CCE

例外场景：NPD无法检测所有PV（数据盘）丢失，导致VG（存储池）丢失的场景；此时依赖kubelet自动隔离该节点，其检测到VG（存储池）丢失并更新nodestatus.allocatable中对应资源为0，避免依赖存储池的Pod调度到该节点上。无法检测单个PV损坏；此时依赖R

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
CCE节点故障检测 - 云容器引擎 CCE

CCE节点故障检测插件介绍 CCE节点故障检测插件（node-problem-detector，简称NPD）是一款监控集群节点异常事件的插件，以及对接第三方监控平台功能的组件。它是一个在每个节点上运行的守护程序，可从不同的守护进程中搜集节点问题并将其报告给apiserver。n

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
设置容器健康检查 - 云容器引擎 CCE

现健康检查协议等。图4 GRPC检查公共参数说明表1 公共参数说明参数参数说明检测周期（periodSeconds）探针检测周期，单位为秒。例如，设置为30，表示每30秒检测一次。延迟时间（initialDelaySeconds）延迟检查时间，单位为秒，此设置与业务程序正常启动时间相关。

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 配置工作负载
配置节点故障检测策略 - 云容器引擎 CCE

配置节点故障检测策略节点故障检查功能依赖node-problem-detector（简称：npd），npd是一款集群节点监控插件，插件实例会运行在每个节点上。本文介绍如何开启节点故障检测能力。前提条件集群中已安装CCE节点故障检测插件。开启节点故障检测登录CCE控制台，单击集群名称进入集群。

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 节点运维
CCE节点故障检测插件版本发布记录 - 云容器引擎 CCE

CCE节点故障检测插件版本发布记录表1 CCE节点故障检测插件版本记录插件版本支持的集群版本更新特性社区版本 1.19.16 v1.21 v1.23 v1.25 v1.27 v1.28 v1.29 v1.30 v1.31 支持CCE v1.31集群 0.8.10 1.19

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
Caffe分类范例 - 云容器引擎 CCE
Caffe分类范例 - 云容器引擎 CCE

/home/caffeEx00.py。挂载刚刚导入的OBS存储盘：单击“创建”。等待job执行完成，进入OBS存储盘的outputimg下，可以看到推理使用的图片。登录在集群中添加GPU节点添加的节点，执行docker logs {容器id}查看归类结果，可以看到结果：tabby cat。使用GPU

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Caffe
存活探针（Liveness Probe） - 云容器引擎 CCE

常工作，但是JVM进程却是一直运行的，对于这种应用本身业务出了问题的情况，Kubernetes提供了Liveness Probe机制，通过检测容器响应是否正常来决定是否重启，这是一种很好的健康检查机制。毫无疑问，每个Pod最好都定义Liveness Probe，否则Kubernetes无法感知Pod是否正常运行。

帮助中心 > 云容器引擎 CCE > Kubernetes基础知识 > Pod、Label和Namespace
管理节点污点 - 云容器引擎 CCE

的一个控制器初始化这个节点后，kubelet 将删除这个污点。相关操作：容忍度（Toleration）容忍度应用于Pod上，允许（但并不要求）Pod 调度到带有与之匹配的污点的节点上。污点和容忍度相互配合，可以用来避免 Pod 被分配到不合适的节点上。每个节点上都可以应用

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 管理节点
NPD插件版本过低导致进程资源残留问题 - 云容器引擎 CCE

登录到CCE集群的ECS节点，查询存在大量npd进程。解决方案升级CCE节点故障检测（简称NPD）插件至最新版本。登录CCE控制台，进入集群，在左侧导航栏中选择“插件中心”，单击CCE节点故障检测下的“升级”。如果CCE节点故障检测插件版本已经为1.13.6及以上版本，则不需要进行升级操作。

帮助中心 > 云容器引擎 CCE > 常见问题 > 模板插件
使用Service实现简单的灰度发布和蓝绿发布 - 云容器引擎 CCE

使用Service实现简单的灰度发布和蓝绿发布 CCE实现灰度发布通常需要向集群额外部署其他开源工具，例如Nginx Ingress，或将业务部署至服务网格，利用服务网格的能力实现。这些方案均有一些难度，如果您的灰度发布需求比较简单，且不希望引入过多的插件或复杂的用法，则可以参考

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 发布
对象存储卷概述 - 云容器引擎 CCE

标准存储：访问时延低和吞吐量高，因而适用于有大量热点文件（平均一个月多次）或小文件（小于1MB），且需要频繁访问数据的业务场景，例如：大数据、移动应用、热点视频、社交图片等场景。低频访问存储：适用于不频繁访问（平均一年少于12次）但在需要时也要求快速访问数据的业务场景，例如：文件同步/共享、企业备份等场景

 帮助中心 > 云容器引擎 CCE > 用户指南 > 存储管理-Flexvolume（已弃用） > 对象存储卷
工作负载异常：实例调度失败 - 云容器引擎 CCE

工作负载异常：实例调度失败问题定位当Pod状态为“Pending”，事件中出现“实例调度失败”的信息时，可根据具体事件信息确定具体问题原因。事件查看方法请参见工作负载状态异常定位方法。排查思路根据具体事件信息确定具体问题原因，如表1所示。表1 实例调度失败事件信息问题原因与解决方案

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
CCE节点NTP时间不同步如何解决？ - 云容器引擎 CCE

节点上的ntpd在长时间无法连接ntpserver等特殊场景下，可能导致偏移量过大，无法自动恢复。问题检测 CCE节点故障检测插件（npd）中已包含节点时间同步检查项，您可以在集群中安装该插件进行检测。详情请参见CCE节点故障检测。问题根因 EulerOS和CentOS类型的节点存在由NTP引起的已知问题，其他类型的节点不涉及该问题。

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
高性能调度 - 云容器引擎 CCE
高性能调度 - 云容器引擎 CCE

高性能调度 CCE通过集成Volcano提供高性能计算能力。 Volcano是基于Kubernetes的批处理系统。Volcano提供了一个针对BigData和AI场景下，通用、可扩展、高性能、稳定的原生批量计算平台，方便AI、大数据、基因、渲染等诸多行业通用计算框架接入，提供高

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 应用场景
使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

使用Kubeflow和Volcano实现典型AI训练任务 Kubernetes已经成为云原生应用编排、管理的事实标准，越来越多的应用选择向Kubernetes迁移。人工智能和机器学习领域天然的包含大量的计算密集型任务，开发者非常愿意基于Kubernetes构建AI平台，充分利用

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
NPU调度 - 云容器引擎 CCE
NPU调度 - 云容器引擎 CCE

NPU调度 CCE支持在容器中使用NPU资源。前提条件创建NPU类型节点，具体请参见创建节点。安装huawei-npu插件，具体请参见CCE AI套件（Ascend NPU）。使用NPU 创建工作负载申请NPU资源，可按如下方法配置，指定显卡的数量。 kind: Deployment

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度
使用Kubernetes默认GPU调度 - 云容器引擎 CCE

使用Kubernetes默认GPU调度 CCE支持在容器中使用GPU资源。前提条件创建GPU类型节点，具体请参见创建节点。集群中需要安装GPU插件，且安装时注意要选择节点上GPU型号对应的驱动，具体请参见CCE AI套件（NVIDIA GPU）。在v1.27及以下的集群中

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
使用Nginx Ingress实现灰度发布和蓝绿发布 - 云容器引擎 CCE

使用Nginx Ingress实现灰度发布和蓝绿发布本文将介绍使用Nginx Ingress实现灰度发布和蓝绿发布的应用场景、用法详解及实践步骤。应用场景使用Nginx Ingress实现灰度发布适用场景主要取决于业务流量切分的策略，目前Nginx Ingress支持基于H

帮助中心 > 云容器引擎 CCE > 最佳实践 > 发布
使用ASM实现灰度发布和蓝绿发布 - 云容器引擎 CCE

使用ASM实现灰度发布和蓝绿发布应用服务网格（Application Service Mesh，简称ASM）是基于开源Istio推出的服务网格平台，它深度、无缝对接了企业级Kubernetes集群服务云容器引擎（CCE），在易用性、可靠性、可视化等方面进行了一系列增强，可为客户提供开箱即用的上手体验。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 发布
创建集群时指定要安装的插件 - 云容器引擎 CCE

node-local-dns：表示安装节点本地域名解析加速插件。 volcano：表示安装Volcano调度器插件。 npd：表示安装CCE节点故障检测插件。 cie-collector：表示安装云原生监控插件。 log-agent：表示安装云原生日志采集插件。 virtual-kubelet：表示安装CCE突发弹性引擎（对接

 帮助中心 > 云容器引擎 CCE > API参考 > 附录

总条数： 533

上一页
1
2
3
4
5
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CCE节点故障检测 - 云容器引擎 CCE

CCE节点故障检测 - 云容器引擎 CCE

设置容器健康检查 - 云容器引擎 CCE

配置节点故障检测策略 - 云容器引擎 CCE

CCE节点故障检测插件版本发布记录 - 云容器引擎 CCE

Caffe分类范例 - 云容器引擎 CCE

存活探针（Liveness Probe） - 云容器引擎 CCE

管理节点污点 - 云容器引擎 CCE

NPD插件版本过低导致进程资源残留问题 - 云容器引擎 CCE

使用Service实现简单的灰度发布和蓝绿发布 - 云容器引擎 CCE

对象存储卷概述 - 云容器引擎 CCE

工作负载异常：实例调度失败 - 云容器引擎 CCE

CCE节点NTP时间不同步如何解决？ - 云容器引擎 CCE

高性能调度 - 云容器引擎 CCE

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

NPU调度 - 云容器引擎 CCE

使用Kubernetes默认GPU调度 - 云容器引擎 CCE

使用Nginx Ingress实现灰度发布和蓝绿发布 - 云容器引擎 CCE

使用ASM实现灰度发布和蓝绿发布 - 云容器引擎 CCE

创建集群时指定要安装的插件 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线