搜索_华为云

GPU节点使用nvidia驱动启动容器排查思路 - 云容器引擎 CCE

txt 然后查看容器所在节点的nvidia驱动版本支持的cuda版本范围，是否包含容器中的cuda版本。相关链接工作负载异常：GPU节点部署服务报错父主题：节点运行

 帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
集群概述 - 云容器引擎 CCE
集群概述 - 云容器引擎 CCE

Engine，简称CCE）是一个企业级的Kubernetes集群托管服务，支持容器化应用的全生命周期管理，为您提供高度可扩展的、高性能的云原生应用部署和管理方案。集群类型 CCE Standard集群：是云容器引擎服务的标准版本集群，提供商用级容器集群服务，并完全兼容开源Kubernetes集群标准功

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群
监控运维配置 - 云容器引擎 CCE

作负载，Prometheus会通过采集配置对这些指标进行采集。详情请参见使用云原生监控插件监控自定义指标。对接AOM监控服务 AOM实例是应用运维管理服务（AOM）推出的Prometheus监控功能。启用后指标会上报到您选择的AOM实例，其中容器基础指标免费，其他指标按需收费。

帮助中心 > 云容器引擎 CCE > 用户指南 > 配置中心
metadata - 云容器引擎 CCE
metadata - 云容器引擎 CCE

配置项创建后名称不允许修改 - 配置项资源名称，为资源主键，指定后不支持修改命名空间配置项所属命名空间参数名取值范围默认值是否允许修改作用范围 namespace 集群中存在的命名空间 default 支持初始化时配置，不支持后续修改 - 命名空间为资源的隔离维度，一旦指定后不允许修改

 帮助中心 > 云容器引擎 CCE > 配置参考 > 配置项
Node视图 - 云容器引擎 CCE
Node视图 - 云容器引擎 CCE

node_memory_MemTotal_bytes gauge 节点内存总字节数 node_cpu_seconds_total counter 在不同模式下节点累计CPU花费的时间 container_cpu_usage_seconds_total counter 容器CPU累计使用时间 container_memory_rss

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
runc systemd属性注入漏洞公告（CVE-2024-3154） - 云容器引擎 CCE

性（如：ExecStartPre、ExecStart、ExecReload），进而在宿主机中执行任意操作。 CCE集群未使用runc的systemd cgroup特性，因此不受此漏洞影响。判断方法您可以在节点上执行命令查看容器引擎使用的cgroup。容器引擎为containerd的节点，执行以下命令：

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
基于Prometheus指标的弹性伸缩实践 - 云容器引擎 CCE

spec: endpoints: # 定义要监控的服务的端点，包括名称、端口、路径、协议等信息 - interval: 30s # 表示Prometheus Operator将每30秒检查一次服务是否需要添加到监控目标列表中 port: http

帮助中心 > 云容器引擎 CCE > 最佳实践 > 弹性伸缩
漏洞修复策略 - 云容器引擎 CCE

为了防止客户遭遇不当风险，除漏洞背景信息、漏洞详情、漏洞原理分析、影响范围/版本/场景、解决方案以及参考信息等内容外，CCE不提供有关漏洞细节的其他信息。此外，CCE为所有客户提供相同的信息，以平等地保护所有客户。CCE不会向个别客户提供事先通知。最后，CCE不会针对产品中的漏洞开发或发布可利用的入侵代码（或“验证性代码”）。

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
云原生混部概述 - 云容器引擎 CCE

业务“潮汐”特性明显，预留资源较多：在线业务具有明显日级别波峰、波谷特性，用户为保证服务的性能和稳定性按照波峰申请资源，集群的大部分资源处于闲置状态。在线和离线作业分布不同集群，资源无法分时复用：用户为在线和离线作业划分不同的K8s集群中，在线业务在波谷时，无法部署离线作业使用这部分资源。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > 云原生混部
公平调度（DRF） - 云容器引擎 CCE

1和Job 2分别为两个工作负载，其请求的资源量如图所示，通过DRF计算之后，Job 1的主资源为Memory，对应的Share值为0.4，Job 2的主资源为CPU，对应的Share值为0.5，根据Share值对比，Job 1的资源请求量小于Job 2，按照最大最小公平算法分配策略，Job

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > AI任务性能增强调度
采集控制面组件日志 - 云容器引擎 CCE

e-scheduler三个组件。约束与限制如您需要查看集群控制面组件日志，集群必须为v1.21.7-r0及以上补丁版本、v1.23.5-r0及以上补丁版本或1.25版本。请确保云日志服务LTS资源配额充足，LTS的默认配额请参见基础资源。集群控制面组件说明当前CCE支持

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 日志中心
采集Kubernetes审计日志 - 云容器引擎 CCE

是否上报Kubernetes审计日志到云日志服务（LTS）。约束与限制如您需要查看集群Kubernetes审计日志，集群必须为v1.21.7-r0及以上补丁版本、v1.23.5-r0及以上补丁版本或1.25版本。请确保云日志服务LTS资源配额充足，LTS的默认配额请参见基础资源。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 日志中心
NetworkPolicy - 云容器引擎 CCE
NetworkPolicy - 云容器引擎 CCE

图1 podSelector 目标Pod具有role=db标签，该Pod只允许带有role=frontend标签的Pod访问其6379端口。设置该网络策略的具体操作步骤如下：创建名为access-demo1.yaml文件。 vim access-demo1.yaml 以下为YAML文件内容：

帮助中心 > 云容器引擎 CCE > Kubernetes基础知识 > Kubernetes网络
NPD插件版本过低导致进程资源残留问题 - 云容器引擎 CCE

问题现象登录到CCE集群的ECS节点，查询存在大量npd进程。解决方案升级CCE节点故障检测（简称NPD）插件至最新版本。登录CCE控制台，进入集群，在左侧导航栏中选择“插件中心”，单击CCE节点故障检测下的“升级”。如果CCE节点故障检测插件版本已经为1.13.6及以上版本，则不需要进行升级操作。

帮助中心 > 云容器引擎 CCE > 常见问题 > 模板插件
云原生监控 - 云容器引擎 CCE
云原生监控 - 云容器引擎 CCE

scrapeInterval 是 String 默认指标采集周期，默认值15s shards 否 Integer 采集分片数，仅在agent模式下生效，默认值1 表4 resources字段数据结构说明参数是否必选参数类型描述 limitsCpu 是 String CPU大小限制，单位：m

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
采集Kubernetes事件 - 云容器引擎 CCE

云原生日志采集插件插件可采集Kubernetes事件上报到云日志服务（LTS）和应用运维管理（AOM），用于保存事件信息和事件告警。费用说明 LTS创建日志组免费，并每月赠送每个账号一定量免费日志采集额度，超过免费额度部分将产生费用（价格计算器）。 Kubernetes事件上报云日志服务（LTS）根据不同的场景，

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 日志中心
如何退订我的云容器引擎？ - 云容器引擎 CCE

退订完成后云资源将被删除，数据无法找回，请谨慎操作。页面中间有关于5天无理由退订的已退订次数和剩余退订次数提示，请注意查看。进入“云服务退订”页面。单击“退订使用中的资源”页签。单个资源退订与批量退订可使用不同的操作方式：退订单个资源：单击待退订资源所在行的“退订资源”。

帮助中心 > 云容器引擎 CCE > 常见问题 > 计费类
使用节点DNS缓存NodeLocal DNSCache - 云容器引擎 CCE

延迟增加：CoreDNS需要处理更多的请求，可能会导致DNS查询变慢，从而影响业务性能。资源占用率增加：为保证DNS性能，CoreDNS往往需要更高规格的配置。解决方案 NodeLocal DNSCache可以提升服务发现的稳定性和性能。关于NodeLocal DNSCache的介绍及如何在CCE集群中部署NodeLocal

帮助中心 > 云容器引擎 CCE > 最佳实践 > 网络 > CoreDNS配置优化实践 > 客户端
DevOps持续交付 - 云容器引擎 CCE

间断的补全用户体验，提升服务质量，为业务创新提供源源不断的动力。大量交付实践表明，不仅传统企业，甚至互联网企业都可能在持续集成方面存在研发效率低、工具落后、发布频率低等方面的问题，需要通过持续交付提高效率，降低发布风险。价值云容器引擎搭配容器镜像服务提供DevOps持续交付能

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 应用场景
就绪探针（Readiness Probe） - 云容器引擎 CCE

（Liveness Probe）相同，就绪探针也支持如下三种类型。 Exec：Probe执行容器中的命令并检查命令退出的状态码，如果状态码为0则说明已经就绪。 HTTP GET：往容器的IP:Port发送HTTP GET请求，如果Probe收到2xx或3xx，说明已经就绪。 TCP

帮助中心 > 云容器引擎 CCE > Kubernetes基础知识 > Kubernetes网络

总条数： 1185

上一页
1
...
51
52
53
...
60
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU节点使用nvidia驱动启动容器排查思路 - 云容器引擎 CCE

集群概述 - 云容器引擎 CCE

监控运维配置 - 云容器引擎 CCE

metadata - 云容器引擎 CCE

Node视图 - 云容器引擎 CCE

runc systemd属性注入漏洞公告（CVE-2024-3154） - 云容器引擎 CCE

基于Prometheus指标的弹性伸缩实践 - 云容器引擎 CCE

漏洞修复策略 - 云容器引擎 CCE

云原生混部概述 - 云容器引擎 CCE

公平调度（DRF） - 云容器引擎 CCE

采集控制面组件日志 - 云容器引擎 CCE

采集Kubernetes审计日志 - 云容器引擎 CCE

NetworkPolicy - 云容器引擎 CCE

NPD插件版本过低导致进程资源残留问题 - 云容器引擎 CCE

云原生监控 - 云容器引擎 CCE

采集Kubernetes事件 - 云容器引擎 CCE

如何退订我的云容器引擎？ - 云容器引擎 CCE

使用节点DNS缓存NodeLocal DNSCache - 云容器引擎 CCE

DevOps持续交付 - 云容器引擎 CCE

就绪探针（Readiness Probe） - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线