搜索_华为云

Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

（SDK）等工具构建容器，并创建Kubernetes资源训练其模型。模型训练完成后，用户还可以使用KFServing创建和部署用于推理的服务器。再结合pipeline（流水线）功能可实现端到端机器学习系统的自动化敏捷构建，实现AI领域的DevOps。前提条件已在CCE创建一个

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
runc符号链接挂载与容器逃逸漏洞预警公告（CVE-2021-30465） - 云容器引擎 CCE

P_DAC_READ_SEARCH、CAP_SYS_ADMIN等通过seccomp限制攻击者对宿主机内核的系统调用权限，具体请参见使用Seccomp限制容器的系统调用。 CCE新创建节点已经解决该漏洞。您可以先创建新的节点，然后将老节点设置为不可调度，待老节点上应用都调度到新节点上后，删掉老节点或重置老节点。

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
诊断项及修复方案 - 云容器引擎 CCE

工作负载”监控中查看prometheus实例相关指标情况，如果长时间达到瓶颈，可调整prometheus实例规格。说明： PVC资源使用率的检查在云原生监控插件为“本地数据存储”时执行，该模式下，采集到的指标数据会存放入集群PV中。 prometheus工作负载近24小时内存使用率最大值是否超过80% 是

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 健康中心
PV、PVC和StorageClass - 云容器引擎 CCE

是命名空间级别的资源，PV可以与任何命名空间的PVC资源绑定。图2 PV与PVC StorageClass 上节说的PV和PVC方法虽然能实现屏蔽底层存储，但是PV创建比较复杂（可以看到PV中csi字段的配置很麻烦），通常都是由集群管理员管理，这非常不方便。 Kubernete

帮助中心 > 云容器引擎 CCE > Kubernetes基础知识 > 持久化存储
容器异常退出状态码 - 云容器引擎 CCE

命令中使用了未定义的flag，例如docker run --abcd。镜像中用户定义的命令在本机权限不足。容器引擎与宿主机操作系统或硬件不兼容。 126 命令调用错误镜像中调用的命令无法执行，例如文件权限不足或文件不可执行。 127 找不到文件或目录无法找到镜像中指定的文件或目录。 128 无效的退出参数

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
使用HPA+CA实现工作负载和节点联动弹性伸缩 - 云容器引擎 CCE

创建一个有1个节点的集群，节点规格为2U4G及以上，并在创建节点时为节点添加弹性公网IP，以便从外部访问。如创建节点时未绑定弹性公网IP，您也可以前往ECS控制台为该节点进行手动绑定。给集群安装插件。 autoscaler：节点伸缩插件。 metrics-server：是Kubernetes

帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩
主机路径（HostPath） - 云容器引擎 CCE

容器工作负载”。登录CCE控制台。在创建工作负载时，在“容器配置”中找到“数据存储”，选择“主机路径(HostPath)”。设置添加本地磁盘参数，如表1。表1 卷类型选择主机路径挂载参数参数说明存储类型主机路径(HostPath)。主机路径输入主机路径，如/etc/hosts。

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储
CCE突发弹性引擎（对接CCI） - 云容器引擎 CCE

cluster_id 是 String 集群ID cluster_name 是 String 集群的名称 vpc_id 是 String 虚拟私有云ID network_id 是 String 子网ID security_group_id 是 String 安全组ID project_id

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
基于GPU监控指标的工作负载弹性伸缩配置 - 云容器引擎 CCE

其中{Pod IP}是GPU插件的Pod IP，返回指标结果则为正常。在集群中安装3.9.5及以上版本的云原生监控插件，且部署模式需选择“本地数据存储”。采集GPU指标登录CCE控制台，单击集群名称进入集群，在左侧导航栏中选择“配置项与密钥”。切换至“monitoring”

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
单集群视角的成本洞察 - 云容器引擎 CCE

选中时间内成本分布。当前资源涵盖范围有：ECS成本、EVS成本、CCE集群管理成本成本趋势每天的成本分布趋势。从中可以看出，集群内成本开销趋势，可识别花费较高的资源图3 集群各维度成本分析名称含义命名空间命名空间总成本：按命名空间聚合工作负载的成本，包括 CPU 成本（ECS）、内存成本（ECS）、EVS

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生成本治理 > 成本洞察
使用通用文件存储（SFS 3.0）自动收集异常退出的JVM转储文件 - 云容器引擎 CCE

查看挂载的文件系统里的文件，目录中存在转储文件java_pid1.hprof。如果您需要定位到程序发生OOM的代码行数，可以将java_pid1.hprof下载到本地，通过MAT（Eclipse Memory Analyzer Tools）进一步分析JVM堆栈信息。父主题：存储

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 存储
创建使用自定义指标的HPA策略 - 云容器引擎 CCE

在“插件中心”页面右侧找到云原生监控插件，单击“安装”。建议您关注以下配置，其他配置可按需进行设置。详情请参见云原生监控插件。数据存储配置：必选本地数据存储，可选监控数据是否对接AOM或三方监控平台。自定义指标采集：该配置在本实践中必须选择开启，否则将无法采集自定义指标。插件配置完成后，单击“安装”。

帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩 > 工作负载弹性伸缩
管理监控采集任务 - 云容器引擎 CCE

时、最新采集Sample数、错误信息。若您的云原生监控插件开启了采集分片，则会有多个采集实例，可在采集实例处进行切换。在云原生监控插件本地数据存储关闭的情况下，采集端点支持单击直接访问，查看采集结果，方便您对采集任务进行查看和分析管理。采集端点访问403的原因是什么？该如何处理？

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
CCE容器存储插件（Everest） - 云容器引擎 CCE

com", "driver_init_image_version": "2.4.4", "ecsEndpoint": "https://ecs.***.com", "everest_image_version": "2.4.4",

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
Tensorflow训练 - 云容器引擎 CCE
Tensorflow训练 - 云容器引擎 CCE

metadata: name: tfjob-simple namespace: kubeflow spec: tfReplicaSpecs: Worker: replicas: 2 restartPolicy: OnFailure template:

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
负载感知调度 - 云容器引擎 CCE

14及以上版本的插件，详情请参见Volcano调度器。已安装CCE云原生监控插件（kube-prometheus-stack），并开启“本地数据存储”模式，详情请参见云原生监控插件。若您使用的是自建Prometheus监控系统，建议Prometheus版本为2.35.0及以上，

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > 资源利用率优化调度
通过节点池升级节点的GPU驱动版本 - 云容器引擎 CCE

务运行。登录CCE控制台，单击集群名称进入集群控制台。单击“节点管理”，找到更新驱动的节点池，单击“节点列表”。单击节点名称跳转到ECS界面。单击右上角“重启”。步骤三：验证驱动升级是否成功节点完成重启后，请稍等几分钟，等待驱动安装。登录节点，查看节点上的驱动是否更新。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
linux内核导致的容器逃逸漏洞公告（CVE-2022-0492） - 云容器引擎 CCE

18.0-147.5.1.6.h541.eulerosv2r9.x86_64版本节点。为工作负载配置seccomp，限制unshare系统调用，详情请参考Kuberenetes社区文档。限制容器内进程权限，最小化容器内的进程权限，如使用非root启动进程、通过capability机制细化进程权限等。

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
节点池亲和性调度 - 云容器引擎 CCE

}, { "name": "nodeCSIscheduling" }, {

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > 资源利用率优化调度
监控中心概述 - 云容器引擎 CCE

nt的组件，用于采集指标、日志和应用性能数据。对于在ECS、BMS控制台直接购买的主机，您需手动安装ICAgent。对于集群节点，ICAgent会自动安装，您不用手动安装ICAgent。详情请参见安装ICAgent（华为云主机）。父主题：监控中心

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心

总条数： 644

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Kubeflow部署 - 云容器引擎 CCE

runc符号链接挂载与容器逃逸漏洞预警公告（CVE-2021-30465） - 云容器引擎 CCE

诊断项及修复方案 - 云容器引擎 CCE

PV、PVC和StorageClass - 云容器引擎 CCE

容器异常退出状态码 - 云容器引擎 CCE

使用HPA+CA实现工作负载和节点联动弹性伸缩 - 云容器引擎 CCE

主机路径（HostPath） - 云容器引擎 CCE

CCE突发弹性引擎（对接CCI） - 云容器引擎 CCE

基于GPU监控指标的工作负载弹性伸缩配置 - 云容器引擎 CCE

单集群视角的成本洞察 - 云容器引擎 CCE

使用通用文件存储（SFS 3.0）自动收集异常退出的JVM转储文件 - 云容器引擎 CCE

创建使用自定义指标的HPA策略 - 云容器引擎 CCE

管理监控采集任务 - 云容器引擎 CCE

CCE容器存储插件（Everest） - 云容器引擎 CCE

Tensorflow训练 - 云容器引擎 CCE

负载感知调度 - 云容器引擎 CCE

通过节点池升级节点的GPU驱动版本 - 云容器引擎 CCE

linux内核导致的容器逃逸漏洞公告（CVE-2022-0492） - 云容器引擎 CCE

节点池亲和性调度 - 云容器引擎 CCE

监控中心概述 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线