检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
旦出现故障将会使整个集群无法使用,可能会形成十分严重的生产事件。 面对以上的种种不足,CCE提供了简单的集群管理能力和灵活的弹性放缩能力,深度集成应用服务网格和Helm标准模板,能够有效帮助企业简化集群运维管理方式,降低运营成本,以简单易用、高性能、安全可靠、开放兼容等诸多优点,
CronHPA更新待伸缩资源对象的副本数成功。 CustomedHPA CustomedHPA解析冷却时间失败 FailedSetPolicySettings 重要 解析CustomedHPA的冷却时间失败。 CustomedHPA CustomedHPA处理定时/指标规则失败 FailedSubmitRule
模板版本 cluster_id String 集群ID cluster_name String 集群名称 create_at String 创建时间 description String 模板实例描述 name String 模板实例名称 namespace String 模板实例所在的命名空间
容器CPU使用率:Pod的每个容器在不同的时间段的CPU使用量占它们的CPU Limit量的比例。 容器内存使用率:Pod的每个容器在不同的时间段的内存使用量占它们的内存Limit量的比例。 容器CPU受限:Pod的每个容器在不同的时间段的CPU受限时间所占的比例。 容器网络丢包率:Po
容器引擎说明 容器引擎介绍 容器引擎是Kubernetes最重要的组件之一,负责管理镜像和容器的生命周期。Kubelet通过Container Runtime Interface (CRI) 与容器引擎交互,以管理镜像和容器。 CCE当前支持用户选择Containerd和Dock
网络流出速率:节点上的物理网卡在不同的时间段的每秒钟发送的字节数。 网络流入速率:节点上的物理网卡在不同的时间段的每秒钟接收的字节数。 网络发送丢包率:节点的物理网卡网络发送丢包速率。 网络接收丢包率:节点的物理网卡网络接收丢包率。 磁盘相关指标 磁盘读取速率:节点上的每个文件系统在不同的时间段的每秒钟读取的字节数。
管理命名空间 使用命名空间 创建工作负载时,您可以选择对应的命名空间,实现资源或租户的隔离。 查询工作负载时,选择对应的命名空间,查看对应命名空间下的所有工作负载。 命名空间使用实践 按照不同环境划分命名空间 一般情况下,工作负载发布会经历开发环境、联调环境、测试环境,最后到生产
iptables与IPVS如何选择 kube-proxy是Kubernetes集群的关键组件,负责Service和其后端容器Pod之间进行负载均衡转发。 CCE当前支持iptables和IPVS两种服务转发模式,各有优缺点。 特性差异 iptables IPVS 定位 成熟稳定的
CPU:负载的所有Pod的容器在不同的时间段使用的CPU总量占负载的所有Pod的容器的CPU Limit总量的比例。 CPU 受限(CPU Throttled):负载的所有Pod的容器在不同的时间段的CPU受限时间所占的平均比例。 内存相关指标 内存使用率:负载的所有Pod的容器在不同的时间段使用的内存总
在高级配置中选择“升级策略”,设置缩容时间窗,即terminationGracePeriodSeconds参数,指定容器停止前命令执行的等待时间。缩容时间窗时间设置需大于“生命周期”的停止前处理时间,建议在容器停止前命令执行时间的基础上加30s。例如,停止前处理时间设置为30s,因此缩容时间窗设置为60s。
分区的配置信息 表4 metadata 参数 参数类型 描述 name String 分区名称 creationTimestamp String 创建时间 表5 spec 参数 参数类型 描述 hostNetwork hostNetwork object 分区子网 containerNetwork
SUPPORTED:这是一个较老的,但仍然支持的API版本; DEPRECATED:一个被废弃的API版本,该版本将被删除 updated String API发布时间(UTC格式)。例如API版本为v3时,值为'2018-09-15 00:00:00Z'。 version String 如果API的这个
Pod Requests少于用户定义的缩容百分比时,Autoscaler会模拟将该节点上的Pod是否能迁移到其他节点。 当集群节点处于一段时间空闲状态时(默认10min),会触发集群缩容操作(即节点会被自动删除)。当节点存在以下几种状态的Pod时,不可缩容: Pod有设置Pod Disruption
假设一个GPU有N个SM: 一个核函数在整个时间间隔内使用N个线程块运行在所有的SM上,此时该值为1(100%)。 一个核函数在一个时间间隔内运行N/5个线程块,此时该值为0.2。 一个核函数使用N个线程块,在一个时间间隔内,仅运行了1/5个周期的时间,此时该值为0.2。 DCGM_FI_PROF_SM_OCCUPANCY
容冷却时间之间的影响和关系请参见冷却时间说明。 配置修改完成后,单击“确认配置”。 冷却时间说明 节点池中配置的两个冷却时间之间的影响和关系如下: 弹性扩容中的冷却时间 弹性缩容冷却时间:当前节点池扩容出的节点多长时间不能被缩容,作用范围为节点池级别。 弹性缩容中的冷却时间 扩容
点为完全空闲节点,否则认为该节点为非完全空闲。 10 检查周期 节点被判定不可缩容后能再次启动检查的时间间隔。 5min 冷却时间 集群触发弹性缩容后,再次启动缩容评估的冷却时间。 说明: 集群中如果同时存在自动扩容和自动缩容的场景,建议配置该参数为0min,避免由于部分节点池持
未运行的Pod不会被调度到该节点。 未指定容忍时间窗(tolerationSeconds):Pod可以在这个节点上一直运行。 已指定容忍时间窗(tolerationSeconds):在容忍时间窗内,Pod还会在拥有污点的节点上运行,超出时间后会被驱逐。 PreferNoSchedule
每秒执行普罗query的次数 P90查询耗时 秒 不同分片的90%的操作的查询耗时 远端样本滞后比率 秒 存储在WAL中的样本的最高时间戳与远程写入成功的最高时间戳的比率 远程写流量 字节/秒 远程写入的速率 当前队列数 个 当前用于并行发送到远程存储的分片数 最大队列数 个 可用于并行发送到远程存储的分片数的最大值
单击工作负载操作列的“监控”,即可查看Pod的CPU、内存、网络I/O等监控大盘。 通过Pod内存监控查看内存增长曲线,确定异常出现时间。 根据监控、内存增长时间点、日志、进程名等信息,排查Pod内对应进程是否存在内存泄漏。 若OOM是进程内存泄漏导致,请您自行排查泄露原因。 若进程运行
8(ARM)(停止维护) 内核版本 发布时间 发布说明 4.19.36-vhulk1907.1.0.h1350.eulerosv2r8.aarch64 2022年12月 更新系统内核,修复安全漏洞。 EulerOS 2.5(停止维护) 内核版本 发布时间 发布说明 3.10.0-862.14