搜索_华为云

使用PrometheusRules配置普罗监控与告警规则 - 云容器引擎 CCE

使用PrometheusRules配置普罗监控与告警规则 Prometheus具有PrometheusRule的能力，PrometheusRules提供了一种用于监控和警报的规则语言，能够方便用户更好的使用Prometheus查询监控指标，配置基于PromQL的告警规则。当前云原生监控插件仅支持开启本地数

 帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 可观测性最佳实践
移除节点 - 云容器引擎 CCE
移除节点 - 云容器引擎 CCE

清理节点上的CCE组件。登录服务器的管理控制台，完成操作系统的重装，详细步骤请参见切换操作系统。登录服务器，执行如下命令完成CCE组件和LVM数据的清理。将如下脚本写入clean.sh文件。 lsblk vgs --noheadings | awk '{print $1}'

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 管理节点
单部门视角的成本洞察 - 云容器引擎 CCE

上月同期：当前部门上月整月产生的成本环比上月：（月末预测成本 - 上月同期成本）/ 上月同期成本成本趋势年度、季度、月度呈现本年、本季度、本月成本详情，以及分别和上年、上季、上月的成本对比趋势集群维度统计、命名空间维度统计对应部门配置中关联的集群、命名空间的成本统计，不包含部门中的公共成本。如下示例

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生成本治理 > 成本洞察
持续集成及持续部署 - 云容器引擎 CCE

Configuration > Manage Plugins”，在“Available”页签中筛选安装“GitLab”、“Kubernetes CLI”和“Email Extension Template”插件。上述安装的插件版本可能随时间变化发生变动。配置Gitlab Hook 当推送代

 帮助中心 > 云容器引擎 CCE > 最佳实践 > DevOps > 使用Jenkins和Gitlab实现多集群隔离的DevOps流程 > 实施步骤
管理节点标签 - 云容器引擎 CCE

与污点管理”。在弹出的窗口中，在“批量操作”下方单击“新增批量操作”，然后选择“添加/更新”或“删除”。填写需要增加/删除标签的“键”和“值”，单击“确定”。例如，填写的键为“deploy_qa”，值为“true”，就可以从逻辑概念表示该节点是用来部署QA（测试）环境使用。

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 管理节点
通过自定义域名访问集群 - 云容器引擎 CCE

mkdir -p $HOME/.kube mv -f kubeconfig.json $HOME/.kube/config 切换kubectl的访问模式，使用SAN连接集群。 kubectl config use-context customSAN-0 其中customSAN-0为自定义S

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 连接集群
Kubernetes 1.25版本说明 - 云容器引擎 CCE

24版本后，kube-controller-manager和kube-scheduler移除启动参数--port=0和--address。在Kubernetes 1.24版本后，kube-apiserver --audit-log-version和--audit-webhook-version仅支持audit

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 集群概述 > Kubernetes版本发布记录
Node视图 - 云容器引擎 CCE
Node视图 - 云容器引擎 CCE

node_memory_MemTotal_bytes gauge 节点内存总字节数 node_cpu_seconds_total counter 在不同模式下节点累计CPU花费的时间 container_cpu_usage_seconds_total counter 容器CPU累计使用时间 container_memory_rss

帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 监控中心 > 仪表盘
Kubernetes 1.25版本说明 - 云容器引擎 CCE

24版本后，kube-controller-manager和kube-scheduler移除启动参数--port=0和--address。在Kubernetes 1.24版本后，kube-apiserver --audit-log-version和--audit-webhook-version仅支持audit

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 集群版本发布记录 > Kubernetes版本发布记录
节点预留资源策略说明 - 云容器引擎 CCE

4-r0和v1.23.3-r0以下版本集群中，节点内存的预留规则使用v1模型。对于v1.21.4-r0和v1.23.3-r0及以上版本集群，节点内存的预留规则优化为v2模型，请参见CCE对节点内存的预留规则v2。如果节点资源占用比较满，集群升级到v1.21.4-r0和v1.23

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 节点运维
Kubernetes 1.30版本说明 - 云容器引擎 CCE

30版本进行定期的更新，并提供功能增强。关于CCE集群版本的更新说明，请参见补丁版本发布说明。参考链接关于Kubernetes 1.30与其他版本的性能对比和功能演进的更多信息，请参考：Kubernetes v1.30 Release Notes 父主题： Kubernetes版本发布记录

 帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 集群版本发布记录 > Kubernetes版本发布记录
使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

到2个GPU。但是TFJob1和TFJob2均需要4块GPU卡才能运行起来。这样TFJob1和TFJob2处于互相等待对方释放资源，这种死锁情况造成了GPU资源的浪费。亲和调度问题分布式训练中，Ps和Worker存在很频繁的数据交互，所以Ps和Worker之间的带宽直接影响了训练的效率。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
使用kubectl对接已有文件存储 - 云容器引擎 CCE

文件存储支持的读写方式，支持nfs-rw 、nfs-ro。必须和已有PV保持一致。 volume.beta.kubernetes.io/storage-provisioner 必须使用flexvolume-huawei.com/fuxinfs。 storage 存储容量，单位Gi，必须和已有pv的storage大小保持一致。

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储管理-Flexvolume（已弃用） > 文件存储卷
Kubernetes 1.30版本说明 - 云容器引擎 CCE

30版本进行定期的更新，并提供功能增强。关于CCE集群版本的更新说明，请参见补丁版本发布说明。参考链接关于Kubernetes 1.30与其他版本的性能对比和功能演进的更多信息，请参考：Kubernetes v1.30 Release Notes 父主题： Kubernetes版本发布记录

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 集群概述 > Kubernetes版本发布记录
如何根据集群规格调整插件配额？ - 云容器引擎 CCE

2048Mi CCE 容器存储（Everest）集群规格调整后，Everest插件规格需要根据集群的规模和PVC数量进行自定义调整。其中，插件组件的CPU和内存申请值可根据集群节点规模和PVC数量不同进行调整，配置建议请参见表2。非典型场景下，限制值一般估算公式如下： everest-csi-controller：

帮助中心 > 云容器引擎 CCE > 常见问题 > 模板插件
通过AOM配置自定义告警 - 云容器引擎 CCE

主题是消息发布或客户端订阅通知的特定事件类型。它作为发送消息和订阅通知的信道，为发布者和订阅者提供一个可以相互交流的通道。您需要创建一个主题，并订阅。具体方法请参见创建主题和订阅主题。订阅主题后，请前往您的订阅终端（邮件或短信）手动确认添加订阅，消息通知才可生效。创建行动规则 AOM提供告警行动规则

 帮助中心 > 云容器引擎 CCE > 用户指南 > 可观测性 > 告警中心
配置节点故障检测策略 - 云容器引擎 CCE

当前检查项仅1.16.0及以上版本支持。 NPD的检查项主要分为事件类检查项和状态类检查项。事件类检查项对于事件类检查项，当问题发生时，NPD会向APIServer上报一条事件，事件类型分为Normal（正常事件）和Warning（异常事件）表2 事件类检查项故障检查项功能说明

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 节点运维
1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型 - 云容器引擎 CCE

yaml 命令中的yaml名称是示例，请以实际步骤2和步骤3创建的pv和pvc的yaml名字为准。进入应用更新升级界面：更新升级 - 高级设置 - 数据存储 - 云存储。卸载老存储，同时添加CSI格式的PVC的云存储，容器内挂载路径和以前保持一致，实现存储迁移。单击提交，确认后升级生效。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 存储
开通成本洞察 - 云容器引擎 CCE

开通成本洞察成本洞察基于真实账单和集群资源用量统计数据，通过自研的成本画像算法进行成本拆分，提供以部门、集群、命名空间、应用等维度的成本画像。成本洞察能够帮助成本管理人员分析集群成本开销、资源使用状况，识别资源浪费，为下一步的成本优化提供输入。本文主要介绍如何开通成本洞察功能。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生成本治理 > 成本洞察
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

EulerOS 2.0建议使用470及以上版本驱动；Ubuntu 22.04建议使用515及以上版本驱动。插件安装完成后，GPU 虚拟化和节点池驱动配置请前往“配置中心 > 异构资源配置”页进行设置。单击“安装”，安装插件的任务即可提交成功。卸载插件将会导致重新调度的GPU

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生异构计算插件

总条数： 735

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用PrometheusRules配置普罗监控与告警规则 - 云容器引擎 CCE

移除节点 - 云容器引擎 CCE

单部门视角的成本洞察 - 云容器引擎 CCE

持续集成及持续部署 - 云容器引擎 CCE

管理节点标签 - 云容器引擎 CCE

通过自定义域名访问集群 - 云容器引擎 CCE

Kubernetes 1.25版本说明 - 云容器引擎 CCE

Node视图 - 云容器引擎 CCE

Kubernetes 1.25版本说明 - 云容器引擎 CCE

节点预留资源策略说明 - 云容器引擎 CCE

Kubernetes 1.30版本说明 - 云容器引擎 CCE

使用Kubeflow和Volcano实现典型AI训练任务 - 云容器引擎 CCE

使用kubectl对接已有文件存储 - 云容器引擎 CCE

Kubernetes 1.30版本说明 - 云容器引擎 CCE

如何根据集群规格调整插件配额？ - 云容器引擎 CCE

通过AOM配置自定义告警 - 云容器引擎 CCE

配置节点故障检测策略 - 云容器引擎 CCE

1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型 - 云容器引擎 CCE

开通成本洞察 - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线