检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集群创建成功后,您还需要在集群中创建运行工作负载的节点。 登录CCE控制台。 单击创建的集群,进入集群控制台。 在左侧菜单栏选择节点管理,切换至“节点”页签,单击右上角“创建节点”,在弹出的页面中配置节点的参数。 本例中大多数配置保留默认值,仅解释必要参数。 表2 创建节点参数配置
0秒,实际使用时请根据业务的特点选择合适的画像周期,以覆盖业务完整的资源使用规律周期。 等待大约2分钟让Volcano agent完成配置切换和画像数据的积累,然后重新运行3中的施加负载命令,通过查询的超卖资源量,可以再次绘制CPU超卖量图表。 可以看到,在整个脚本运行过程中,基
自建Kubernetes或使用开源容器引擎: 升级Docker到18.09.2版本,由于开源Docker在17.06之后的版本做了较大变更,涉及架构解耦重构,该办法可能会导致用户容器业务中断,建议做好充分验证,并按节点逐步滚动升级。 仅升级runc,对于17.06等Docke
导致无法正常创建容器,且无法拉取系统镜像 请从其他正常节点复制该镜像恢复 在ECS侧对节点池下的节点进行规格变更 节点的规格与节点池定义的规格不一致,导致在弹性扩缩容时出现非预期现象(多扩或者少扩) 重新将节点规格变更为节点池下定义的规格,或者删除该节点重新扩容。 网络 表2 网络 高危操作 导致后果 误操作后解决方案
Node节点vdb盘受损,通过重置节点仍无法恢复节点? 问题现象 客户node节点vdb盘受损,通过重置节点,无法恢复节点。 问题过程: 在一个正常的node节点上,删除lv,删除vg,节点不可用。 重置异常节点,重置过程中,报语法错误,而且节点不可用。 如下图: 问题定位 no
nginx-elb-svc.yaml 配置验证 登录ELB控制台,查看Service对应的ELB(本示例中名为james)。 单击ELB名称,并切换至“监控”,可以看到ELB的连接数为0。 使用kubectl命令行登录集群中的任意一个Nginx容器中,然后访问ELB的地址。 查询集群中的Nginx容器。
Deleting:删除中,表示集群正处于删除过程中。 Upgrading:升级中,表示集群正处于升级过程中。 Resizing:规格变更中,表示集群正处于变更规格中。 ResizeFailed:规格变更异常,表示集群变更规格异常。 RollingBack:回滚中,表示集群正处于回滚过程中。 RollbackFailed:回滚异常,表示集群回滚异常。
nginx-elb-svc.yaml 配置验证 登录ELB控制台,查看Service对应的ELB(本示例中名为james)。 单击ELB名称,并切换至“监控”,可以看到ELB的连接数为0。 使用kubectl命令行登录集群中的任意一个Nginx容器中,然后访问ELB的地址。 查询集群中的Nginx容器。
s事件中出现“Liveness probe failed: Get http…”时,表示健康检查失败。 解决方案: 请在工作负载详情页中,切换至“容器管理”页签,核查容器的“健康检查”配置信息,排查健康检查策略是否合理或业务是否已异常。 排查项三:容器所在磁盘空间不足 如下磁盘为
创建方式:仅支持“动态创建”。 存储类:默认为csi-disk。 可用区:选择一个可用区,云硬盘只能挂载到同一可用区的节点上,创建后不支持更换可用区,请谨慎选择。 云硬盘类型:请根据需求自定义选择合适的云硬盘类型。 容量(GiB):请根据需求填写容量,默认为10GiB。 单击“创建”,然后填写存储挂载到容器的路径,
ingressClassName: cce 验证七层会话保持是否开启。 登录ELB控制台找到对应的ELB,并在ELB所在行中单击的对应监听器名称。 切换至“转发策略”页签,单击后端服务器组名称,查看会话保持配置是否开启。 图3 开启七层会话保持 在CCE Turbo集群中开启七层会话保持
1.25.0 1.25.21 v1.25 修复autoscaler伸缩策略least-waste默认未启用的问题 修复节点池扩容失败后无法切换到其他节点池扩容且插件有重启动作的问题 默认污点容忍时长修改为60s 扩容规则禁用后仍然触发扩容 1.25.0 1.25.11 v1.25
基于本地存储的传统模式与Prometheus插件类似,数据存储于集群内,消耗较多的计算和存储成本并无法支撑多于400节点的大规模集群。 我们更推荐您切换为本地存储的轻量化模式,将监控数据对接至AOM并按需废弃自定义指标,从成本和可靠性角度来看,是更优的选择。 前提条件 集群版本为v1.21。
登录集群查看告警节点状态,确认异常后,优先将此节点设置为不可调度,并将业务pod调度到其他节点 节点池资源售罄 CCE 节点池资源售罄立即告警 设置自动节点池切换或更换节点池规格 节点创建失败 CCE 创建节点失败立即触发 查看创建节点失败原因,尝试重新创建节点 扩容节点超时 CCE 扩容节点超时立即触发
工作负载异常:已停止 问题现象 工作负载的状态为“已停止”。 问题原因: 工作负载的yaml的中metadata.enable字段为false,导致工作负载被停止,Pod被删除导致工作负载处于已停止状态,如下图所示: 解决方案 将enable字段删除或者将false修改为true。
14版本之后引入延迟队列,保存一段时间内每一次检测的决策建议,然后根据当前所有有效的决策建议来进行决策,从而保证期望的副本数尽量少地发生变更,保证稳定性。 忍受度:可以看成一个缓冲区,当实例变化范围在忍受范围之内的话,保持原有的实例数不变。 首先定义ratio = 当前的指标值
您可以使用以下方式为Ingress配置gzip数据压缩。 通过控制台配置 通过kubectl命令行配置 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“服务”,切换至“路由”页签,在右上角单击“创建路由”。 设置Ingress参数。 本示例中展示配置gzip数据压缩的关键参数,其余参数可按需配置,详情请参见通过控制台创建ELB
检查升级节点是否成功。 变更控制节点规格失败 Failed to change flavor of the master 重要 检查变更控制节点规格是否成功。 变更控制节点规格超时 Change flavor of the master timeout 重要 检查变更控制节点规格是否超时。
命名空间因APIService对象访问失败无法删除 问题现象 删除命名空间时,命名空间一直处“删除中”状态,无法删除。查看命名空间yaml配置,status中有报错“DiscoveryFailed”,示例如下: 上图中报错信息为:Discovery failed for some
M后会进行收费,因此监控中心会默认屏蔽采集该类指标。 登录CCE控制台,单击集群名称进入集群详情页。 在左侧导航栏中选择“配置与密钥”,并切换至“monitoring”命名空间,找到名为“persistent-user-config”的配置项。 单击“更新”,对配置数据进行编辑,