-
SDK概述 - 云容器引擎 CCE
Explorer中具体API页面的“代码示例”页签查看对应编程语言类型的SDK代码,如图1所示。 图1 获取SDK代码示例 SDK列表 表1提供了各个CCE服务支持的SDK列表,您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。 表1 SDK列表 编程语言 Github地址
-
通过X509证书连接集群 - 云容器引擎 CCE
通过X509证书连接集群 操作场景 通过控制台获取集群证书,使用该证书可以访问Kubernetes集群。 操作步骤 登录CCE控制台,单击集群名称进入集群。 查看集群总览页,在右边“连接信息”下证书认证一栏,单击“下载”。 图1 获取证书 在弹出的“证书获取”窗口中,根据系统提示选择证书的过期时间并下载集群X509证书。
-
通过X509证书连接集群 - 云容器引擎 CCE
通过X509证书连接集群 操作场景 通过控制台获取集群证书,使用该证书可以访问Kubernetes集群。 操作步骤 登录CCE控制台,单击集群名称进入集群。 查看集群总览页,在右边“连接信息”下证书认证一栏,单击“下载”。 图1 获取证书 在弹出的“证书获取”窗口中,根据系统提示选择证书的过期时间并下载集群X509证书。
-
通过AOM配置自定义告警 - 云容器引擎 CCE
创建节点失败立即触发 查看创建节点失败原因,尝试重新创建节点 扩容节点超时 CCE 扩容节点超时立即触发 查看扩容节点失超时原因,尝试重新扩容节点 缩容节点失败 CCE 缩容节点超时立即触发 查看缩容节点失超时原因,尝试重新缩容节点 拉取镜像重试失败 CCE 拉取镜像重试失败 登录集群查看拉取镜像失败原因,重新部署业务负载
-
CCE推荐的GPU驱动版本列表 - 云容器引擎 CCE
如果您需要安装最新版本的GPU驱动,请将您的GPU插件升级到最新版本。 表1 GPU驱动支持列表 GPU型号 支持集群类型 机型规格 操作系统 Huawei Cloud EulerOS 2.0(支持GPU虚拟化) Ubuntu 22.04 CentOS Linux release 7.6 EulerOS
-
Solution as Code一键式部署类最佳实践 - 云容器引擎 CCE
统的容器化改造。 CCE、ELB、EIP 快速构建云原生订单管理系统 该方案可帮助您在华为云云容器引擎上快速搭建订单管理系统。 CCE、RDS、RabbitMQ、ELB、EIP 基于CCE快速部署Volcano批量调度系统 该解决方案能帮您快速在华为云CCE容器集群上快速部署Volcano批量调度系统。
-
修改最大文件句柄数 - 云容器引擎 CCE
conf && sysctl -p 执行以下命令检查是否修改成功,当返回与修改值一致时说明修改正确。 # sysctl fs.file-max fs.file-max = 1048576 修改节点单进程最大文件句柄数 登录节点,查看/etc/security/limits.conf文件。
-
使用共享VPC创建CCE Turbo集群 - 云容器引擎 CCE
将本账号的VPC资源共享给其他账号使用。例如,租户A可以将自己账号下创建的VPC和子网共享给租户B。在租户B接受共享以后,租户B账号下可以查看到该共享子网及其所属的共享VPC,并可以使用该共享子网和共享VPC创建资源,如CCE Turbo集群。详情请参见共享VPC概述。 使用场景
-
通过Core Dump文件定位容器问题 - 云容器引擎 CCE
Dump需执行如下操作。 在节点的/usr/lib/systemd/system/docker.service文件中,将LimitCORE的值修改为infinity。 重启Docker。 业务容器重新部署。 容器Core Dump持久化 core文件可以考虑使用HostPath或PV
-
主机视图 - 云容器引擎 CCE
主机视图 从主机视角出发,监控主机的资源占用与健康状态,查看主机的磁盘、文件系统等常用系统设备指标,帮助您掌控节点运行状况。 指标说明 主机视图暴露的指标具体说明如下: 图1 主机资源指标 表1 视图说明 图表名称 单位 说明 CPU使用率 百分比 每个CPU核的使用率 平均负载
-
告警中心概述 - 云容器引擎 CCE
CCE的云原生告警能力是由AOM服务提供的,支持指标和事件的告警。同时,CCE集群详情中增加了告警中心能力,能支持快速配置资源等常用告警和告警查看。 图1 告警中心架构 告警中心 基于AOM服务的告警能力实现,提供集群内的告警快速检索、告警快速配置的能力。用户可以通过告警中心一键配置常用的告警规则。
-
告警中心概述 - 云容器引擎 CCE
CCE的云原生告警能力是由AOM服务提供的,支持指标和事件的告警。同时,CCE集群详情中增加了告警中心能力,能支持快速配置资源等常用告警和告警查看。 图1 告警中心架构 告警中心 基于AOM服务的告警能力实现,提供集群内的告警快速检索、告警快速配置的能力。用户可以通过告警中心一键配置常用的告警规则。
-
为负载均衡类型的Service配置服务器名称指示(SNI) - 云容器引擎 CCE
在配置SNI时,用户需要添加绑定域名的证书,客户端会在发起SSL握手请求时就提交请求的域名信息,负载均衡收到SSL请求后,会根据域名去查找证书。如果找到域名对应的证书,则返回该证书;如果没有找到域名对应的证书,则返回服务器默认证书。 配置SNI后,如果您在CCE控制台删除SN
-
升级前检查异常问题排查 - 云容器引擎 CCE
节点Python命令检查异常处理 ASM网格版本检查异常处理 节点Ready检查异常处理 节点journald检查异常处理 节点干扰ContainerdSock检查异常处理 内部错误异常处理 节点挂载点检查异常处理 K8s节点污点检查异常处理 everest插件版本限制检查异常处理 cce-
-
配置集群环境 - 云容器引擎 CCE
为默认值。 期望初始节点数量:本实践中,1个节点即可满足基本诉求。 节点规格:选择一个4核16GiB的规格。 操作系统:Huawei Cloud EulerOS 2.0。 弹性公网IP:选择“自动创建”,为节点绑定一个EIP,可用于公网镜像拉取等操作。 确认规格后创建该节点。 创建生产集群
-
工作负载异常:GPU节点部署服务报错 - 云容器引擎 CCE
工作负载异常:GPU节点部署服务报错 问题现象 客户在CCE集群的GPU节点上部署服务出现如下问题: 容器无法查看显存。 部署了7个GPU服务,有2个是能正常访问的,其他启动时都有报错。 2个是能正常访问的CUDA版本分别是10.1和10.0 其他服务CUDA版本也在这2个范围内
-
为ELB Ingress配置服务器名称指示(SNI) - 云容器引擎 CCE
在配置SNI时,用户需要添加绑定域名的证书,客户端会在发起SSL握手请求时就提交请求的域名信息,负载均衡收到SSL请求后,会根据域名去查找证书。如果找到域名对应的证书,则返回该证书;如果没有找到域名对应的证书,则返回服务器默认证书。 该功能仅支持1.15.11及以上版本的集群。
-
CCE容器云存储PVC能否感知底层存储故障? - 云容器引擎 CCE
PVC按照社区逻辑实现,PVC本身的定义是存储声明,与底层存储解耦,不负责感知底层存储细节,因此没有感知底层存储故障的能力。 云监控服务CES 具备查看云服务监控指标的能力:云监控服务基于云服务自身的服务属性,已经内置了详细全面的监控指标。当用户在云平台上开通云服务后,系统会根据服务类型自
-
节点池一直在扩容中但“操作记录”里为何没有创建节点的记录? - 云容器引擎 CCE
问题现象 节点池的状态一直处于“扩容中”,但是“操作记录”里面没有看到有对应创建节点的记录。 原因排查: 检查如下问题并修复: 租户是否欠费。 查看节点池配置的规格是否资源不足。 租户的ECS或内存配额是否不足。 如果一次创建节点太多,可能会出现租户的ECS容量校验不过的情况发生。 解决方案:
-
GPU插件检查异常处理 - 云容器引擎 CCE
登录CCE控制台,前往“插件中心”处查看GPU插件。 gpu-beta插件与gpu-device-plugin插件为同一插件。gpu-beta插件在2.0.0版本后,正式更名为gpu-device-plugin。 单击该插件的“升级”按钮,查看插件目标版本及驱动配置。 在测试环境