检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GPU驱动或GPU设备存在异常,请根据GPU设备所在的节点类型(ECS或BMS),联系对应的客服进行处理。 GPU设备存在Uncorrectable ECC错误 登录GPU隔离事件发生的节点。 进入/usr/local/nvidia/bin目录,执行nvidia-smi -q命令。 若nvidia-sm
在节点池详情中切换至“弹性伸缩”页签,可以看到弹性伸缩策略的配置及伸缩记录。 图1 查看弹性伸缩策略 您还可以在“策略”页面中查看已创建的弹性伸缩策略: 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中单击“策略”,切换至“节点伸缩策略”页签。 您可以查看弹性伸缩策略的配置。单击要策略后方的“更多
CCE容器网络扩展指标负责CCE Turbo集群的容器网络流量监控。 DaemonSet 支持的监控项 当前用户可通过创建MonitorPolicy的方式下发监控任务,当前用户可以通过API或登录工作节点kubectl apply的方式创建MonitorPolicy。一个MonitorPol
行失败,请登录节点排查下列命令的可用性。 rpm -qa 如果上述命令不可用,可通过以下命令恢复: rpm --rebuilddb 问题场景二:systemctl status命令执行失败 检查到节点systemctl status命令不可用,将影响众多检查项,请登录节点排查下列命令的可用性。
节点时钟同步服务器检查异常处理 检查项内容 检查节点时钟同步服务器ntpd或chronyd是否运行正常。 解决方案 问题场景一:ntpd运行异常 请登录该节点,执行systemctl status ntpd命令查询ntpd服务运行状态。若回显状态异常,请执行systemctl restart
回退模板工作负载 登录CCE控制台,单击集群名称进入集群,在左侧导航栏中选择“应用模板”,在右侧选择“模板实例”页签。 单击待回退模板实例后的“回退”,选择要回退的模板实例版本,单击“回退”。 模板工作负载列表中,状态为“回退成功”时,表明工作负载回退成功。 卸载模板工作负载 登录CCE控
上传dcgm-exporter镜像到SWR。 (可选)登录SWR管理控制台,选择左侧导航栏的“组织管理”,单击页面右上角的“创建组织”,创建一个组织。 如已有组织可跳过此步骤。 在左侧导航栏选择“我的镜像”,单击右侧“客户端上传”,在弹出的页面中单击“生成临时登录指令”,单击复制登录指令。 在集群节点上执行上
default 支持初始化时配置,不支持后续修改 - 模板实例命名空间 模板名称 参数名 取值范围 默认值 是否允许修改 作用范围 chart_name 当前用户的模板 无 支持初始化时配置,不支持后续修改 - 模板实例使用的模板 模板版本 参数名 取值范围 默认值 是否允许修改
议您通过CCE控制台修改相关配置,以便在升级时自动继承。 集群升级过程中,已运行工作负载业务不会中断,但API Server访问会短暂中断,如果业务需要访问API Server可能会受到影响。 集群升级过程中默认不限制应用调度。但下列旧版本集群升级过程中,仍然会给节点打上“node
节点 节点概述 容器引擎说明 节点操作系统说明 节点规格说明 创建节点 纳管节点 登录节点 管理节点 节点运维 节点管理最佳实践
CCE集群弹性引擎是Kubernetes提供的集群节点弹性伸缩组件,根据Pod调度状态及资源使用情况对集群的节点进行自动扩容缩容,同时支持多可用区、多实例规格、指标触发和周期触发等多种伸缩模式,满足不同的节点伸缩场景。 前提条件 使用节点伸缩功能前,需要安装CCE集群弹性引擎插件,插件版本要求1
本文主要为您介绍工作负载相关实践。 场景分类 相关最佳实践 创建工作负载相关实践 合理分配容器计算资源 在CCE中实现应用高可用部署 升级实例过程中实现业务不中断 通过特权容器功能优化内核参数 使用Init容器初始化应用 CCE中使用x86和ARM双架构镜像 使用SWR触发器自动更新工作负载版本
为300s。 默认:300s 容器迁移对节点无法访问状态的容忍时间 default-unreachable-toleration-seconds 表示节点处于unreachable状态下的容忍时间。当环境出现异常,例如节点无法访问(如节点网络异常)时,容器将在该容忍时间后自动驱逐,默认为300s。
已有节点,无需重置节点。 单个节点同步 登录CCE控制台。 单击集群名称进入集群,在左侧选择“节点管理”,在右侧选择“节点”页签。 节点池中的存量节点将提示“存在更新”。 单击“存在更新”,在提示窗口中确认是否立即重置节点。 批量同步 登录CCE控制台。 单击集群名称进入集群,在
jsonpath="{.data.wordpress-password}" | base64 -d) 回显中告诉了如何获取外部访问地址和登录WordPress后台的用户及密码。 访问WordPress 修改WordPress Service配置。 由于CCE中使用负载均衡Service需要额外
复制节点ID,保存到本地。 图1 复制节点ID 登录异常节点,备份文件 。 cp /var/lib/cloud/data/instance-id /tmp/instance-id cp /var/paas/conf/server.conf /tmp/server.conf 登录异常节点,将获取的节点ID写入文件。
绑定当前PersistentVolume使用。 约束与限制 如下配置示例适用于Kubernetes 1.13及以下版本的集群。 操作步骤 登录OBS控制台,创建对象存储桶,记录桶名称和存储类型。 请参见通过kubectl连接集群,使用kubectl连接集群。 新建两个yaml文件
容器资源(CPU、内存)配额。 表3 custom 参数 是否必选 参数类型 描述 annotations 否 Map<String>String 用户自定义注解。 表4 resources字段数据结构说明 参数 是否必选 参数类型 描述 limitsCpu 是 String CPU大小限制,单位:m
basic 参数 是否必选 参数类型 描述 swr_addr 是 String 插件下载地址,无需指定 swr_user 是 String 插件下载用户,无需指定 platform 是 String 插件平台,无需指定 escEndpoint 是 String ecs地址,无需指定 表3 flavor
制台进行云硬盘存储卷扩容。 前提条件 您已经创建好一个集群,并且在该集群中安装CCE容器存储(Everest)。 按需计费的云硬盘存储卷 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏选择“存储”,在右侧选择“存储卷声明”页签。单击PVC操作列的“更多 > 扩容”。 图1