检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
节点创建出来会存在一些固有的标签,并且是无法删除的,这些标签的含义请参见表1。 系统自动添加的节点固有标签不建议手动修改,如果手动修改值与系统值产生冲突,将以系统值为准。 表1 节点固有标签 键 说明 新:topology.kubernetes.io/region 旧:failure-domain
r中第1个值 最大值:/proc/sys/fs/file-nr中第3个值 节点内存资源不足 MemoryProblem 检查系统关键资源Memory内存资源是否耗尽 默认阈值:80% 使用量:/proc/meminfo中MemTotal-MemAvailable 最大值:/proc/meminfo中MemTotal
节点Python命令检查异常处理 ASM网格版本检查异常处理 节点Ready检查异常处理 节点journald检查异常处理 节点干扰ContainerdSock检查异常处理 内部错误异常处理 节点挂载点检查异常处理 K8s节点污点检查异常处理 everest插件版本限制检查异常处理 cce-
describe node命令查询节点临时卷的容量(Capacity)和可使用量(Allocatable),并可查询节点已分配的临时卷申请值和限制值。 返回示例如下: ... Capacity: cpu: 4 ephemeral-storage:
参数类型 描述 apiVersion 是 String 参数解释: API版本 约束限制: 固定值 取值范围: v3 kind 是 String 参数解释: API类型 约束限制: 固定值 取值范围: UpgradeTask 表4 UpgradeSpec 参数 是否必选 参数类型 描述
live_timeout时长一直没有请求, 负载均衡会暂时中断当前连接,直到下一次请求时重新建立新的连接。 取值范围为0-4000s,默认值为60s。 kubernetes.io/elb.client_timeout 否 String 等待客户端请求超时时间,包括两种情况: 读取
与其它云服务的关系 云容器引擎需要与其他云服务协同工作,云容器引擎需要获取如下云服务资源的权限。 图1 云容器引擎与其他服务的关系示意图 云容器引擎与其他服务的关系 表1 云容器引擎与其他服务的关系 服务名称 云容器引擎与其他服务的关系 主要交互功能 弹性云服务器 ECS 在云容
)。 everest-controller近24小时内存使用率最大值是否超过80% 是 云原生监控插件状态 云原生监控插件状态 否 同上云原生监控插件状态。 prometheus工作负载近24小时CPU使用率最大值是否超过80% 是 云原生监控插件主要提供了集群运维监控的能力,资
GPU故障处理 前提条件 如需将GPU事件同步上报至AOM,集群中需安装云原生日志采集插件,您可前往AOM服务查看GPU插件隔离事件。 GPU插件隔离事件 当GPU显卡出现异常时,系统会将出现问题的GPU设备进行隔离,详细事件如表1所示。 表1 GPU插件隔离事件 事件原因 详细信息
PVC申请容量,单位为Gi。 对SFS Turbo子目录类型的PVC来说,此处仅为校验需要(不能为空和0),设置的大小不起作用,此处可以设定为固定值10Gi。 执行以下命令,创建PVC。 kubectl apply -f pvc-sfsturbo-subpath.yaml 父主题: 极速文件存储(SFS
DEPRECATED:一个被废弃的API版本,该版本将被删除 updated String API发布时间(UTC格式)。例如API版本为v3时,值为'2018-09-15 00:00:00Z'。 version String 如果API的这个版本支持微版本,则支持最大的微版本。如果不支持微版本,这将是空字符串。
kubernetes.io/elb.id: <your_elb_id> # ELB ID,替换为实际值 kubernetes.io/elb.class: performance # 负载均衡器类型
CCE最佳实践汇总 本文汇总了云容器引擎(CCE)服务的常见应用场景,并为每个场景提供详细的方案描述和操作指南,以帮助您在CCE集群中轻松搭建业务。 CCE最佳实践 开发者社区精选最佳实践 Solution as Code一键式部署类最佳实践 表1 CCE最佳实践 分类 相关文档
Namespace #事件对应的资源类型 severity: Major #事件上报到AOM后的事件级别,默认Major。可选值:Critical:紧急;Major:重要;Minor:次要;Info:提示 父主题: 日志中心
数据盘:必须添加一块默认数据盘,供容器运行时和Kubelet组件使用,您可以自行设置数据盘的规格为20GiB-32768GiB之间的数值,缺省值为100GiB。该数据盘不能被删除卸载,否则会导致节点不可用。 系统盘:CCE将下载的镜像、容器的临时存储、容器的stdout标准输出日志等
登录CCE控制台,进入一个已有的集群,在左侧导航栏中选择“工作负载”。 选择“无状态负载”页签,单击工作负载后方操作栏中的“更多 > 标签管理”。 单击,输入键和值后单击“确定”。 图4 标签管理 标签格式要求如下:以字母和数字开头或结尾,由字母、数字、连接符(-)、下划线(_)、点号(.)组成且63字符以内。
编辑log-operator容器的命令行参数,添加命令行--kubernetes-buffer-size=20MB,当前默认值为16MB,请根据节点pod信息总大小估算该值大小。0为无限制。 若升级插件,则需要重新配置该参数。 图13 修改log-operator容器命令行参数 如何修改集群日志中心的日志存储时间?
PU的调度和隔离能力。 前提条件 配置 支持版本 集群版本 v1.23.8-r0、v1.25.3-r0及以上 操作系统 Huawei Cloud EulerOS 2.0操作系统 GPU类型 支持T4、V100类型的GPU 驱动版本 GPU虚拟化功能仅支持470.57.02、510
任务才会完成 表5 Job 参数 参数类型 描述 kind String API类型,固定值“Job”,该值不可修改。 apiVersion String API版本,固定值“v3”,该值不可修改。 metadata JobMetadata object 任务元数据。 spec JobSpec
区域名称和Endpoint以键值对形式对应,<region_name>和<endpoint_address>需替换为具体值,多个取值间使用逗号隔开。 Region对应的值请参见地区和终端节点。 {"cn-south-4": "https://obs.cn-south-4.myhuaweicloud