检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在左侧导航栏中选择“节点管理”,在需要开启动态资源超卖的节点池中,单击“更多 > 混部配置”。 确认“节点池混部开关”及“资源超卖”开关已打开,详情请参见云原生混部配置。 (可选)调整资源超卖参数。 表2 资源超卖参数 名称 说明 CPU驱逐高水位线(%) 当节点CPU使用率超
工作负载创建成功后,容器挂载目录下的数据将会持久化保持,您可以参考验证数据持久化中的步骤进行验证。 验证数据持久化 查看部署的应用及云硬盘文件。 执行以下命令,查看已创建的Pod。 kubectl get pod | grep statefulset-evs 预期输出如下: statefulset-evs-0
态工作负载为例说明如何使用监控功能。 登录CCE控制台,进入一个已有的集群,在左侧导航栏中选择“工作负载”。 选择“无状态负载”页签,单击已创建工作负载后的“监控”。在监控页面,可查看工作负载的CPU利用率和物理内存使用率。 图1 查看无状态工作负载监控 单击工作负载名称,可在“
署。 您可以创建一个公网LoadBalancer类型Service,这样就可以从外部访问Prometheus。 登录CCE控制台,选择一个已安装Prometheus的集群,在左侧导航栏中选择“服务”。 单击右上角“YAML创建”,创建一个公网LoadBalancer类型的Service。
虚拟化和节点池驱动配置请前往“配置中心 > 异构资源配置”页进行设置。 单击“安装”,安装插件的任务即可提交成功。 卸载插件将会导致重新调度的GPU Pod无法正常运行,但已运行的GPU Pod不会受到影响。 验证插件 插件安装完成后,在GPU节点及调度了GPU资源的容器中执行nvidia-smi命令,验证GPU设备及驱动的可用性。
储资源删除,并同步移除PV资源,请谨慎使用。 Retain:存储卷声明PVC删除时,PV和关联的底层存储资源均会保留,其中PV状态被设置为已释放,继续手动删除PV不会删除底层存储资源,若希望该PV还能被PVC绑定,需去除PV上与原PVC绑定的相关信息。 allowVolumeExpansion
3-r0之前的集群版本,需要指定查询参数resourceVersion=0;v1.23.8-r0、v1.25.3-r0及之后的版本,CCE已进行优化,会默认查询缓存并确保缓存数据最新。 精确指定查询范围,避免非目标数据额外消耗资源,例如: # client-go查询指定命名空间的Pod代码示例
需要明确指定可用区,不支持随机可用区。 新创建的节点池,仅按照默认规格创建节点,当默认规格资源不足时,会导致节点创建失败。 节点池创建后,已存在节点的规格不可删除。 容器引擎 CCE支持Docker和Containerd容器引擎,不同的集群类型、集群版本、操作系统可能导致支持的容
集群升级后检查任务 taskID String 升级任务项ID status String 集群升级状态: Init: 任务初始状态 Queuing: 任务已进入执行队列 Running: 任务开始执行 Success: 任务执行成功 Failed: 任务执行失败 startTimeStamp String
pod,查看日志是否正常采集。如依然无法采集,请确认需要采集的文件是否为打包镜像时已经存在于镜像中的日志文件。对于容器日志采集的场景来说,镜像打包时已存在的文件的日志非运行日志,属于无效日志无法采集。该问题为社区已知问题,详情请参见开源issue。 解决方案:若需要采集打包镜像时已经存在于
memory: 200Mi Environment: <none> Mounts: # 表示Pod已挂载sa-example-token,即Pod可以使用这个Token来做认证 /etc/secret-volume from secret-volume
集群升级后检查任务 taskID String 升级任务项ID status String 集群升级状态: Init: 任务初始状态 Queuing: 任务已进入执行队列 Running: 任务开始执行 Success: 任务执行成功 Failed: 任务执行失败 startTimeStamp String
控数据对接至AOM并按需废弃自定义指标,从成本和可靠性角度来看,是更优的选择。 前提条件 集群版本为v1.21。 Prometheus插件已升级至可升级的最新版本。 可迁移的云原生监控插件目标版本为3.10.1及以上。 采集数据迁移 迁移至基于本地存储的传统模式时,数据库是自动迁
集群升级后检查任务 taskID String 升级任务项ID status String 集群升级状态: Init: 任务初始状态 Queuing: 任务已进入执行队列 Running: 任务开始执行 Success: 任务执行成功 Failed: 任务执行失败 startTimeStamp String
工作负载伸缩。 CronHPA支持定时调整HPA策略的最大和最小实例数,也可以直接定时调整Deployment的Pod实例数。 前提条件 已安装1.2.13及以上版本CCE容器弹性引擎。 使用CronHPA调整HPA伸缩范围 CronHPA支持定时调整HPA策略的最大和最小实例数,满足复杂场景下的工作负载伸缩。
TIONS)可配置会话保持;选择“源IP算法”(即kubernetes.io/elb.lb-algorithm参数为SOURCE_IP)时已支持基于源IP地址的会话保持,无需重复配置会话保持。 四层会话保持(Service) 四层的模式下可以开启基于源IP的会话保持(基于客户端的IP进行hash路由)。
监控,且支持通过PodSelector来对监控后端作选择,支持多监控任务、可选监控指标,且支持用户获取Pod的label标签信息。监控信息已适配Prometheus格式,可以通过调用Prometheus接口查看监控数据。 使用约束 仅支持在v1.19及以上版本的CCE Turbo
建一个cluster-admin权限(管理员权限),联邦用户由于每次登录注销都会改变用户ID,所以在CCE控制台权限管理处,权限用户会显示已删除,请勿删除该权限,否则会导致鉴权失败。此种情况下建议在CCE为某个用户组创建cluster-admin权限,将联邦用户加入此用户组。 联
调度器重启后,lifecycle插件需要重新记录负载的变化状况,需要统计数个周期后才能达到最优调度效果。 gang 将一组Pod看做一个整体进行资源分配。观察Job下的Pod已调度数量是否满足了最小运行数量,当Job的最小运行数量得到满足时,为Job下的所有Pod执行调度动作,否则,不执行。 说明: 使用gang调
配置负载亲和/反亲和调度策略 您可以通过不同的方式配置负载亲和/反亲和调度策略,将Pod调度到满足条件的节点。 通过控制台配置 通过YAML配置 本文示例中,集群内已创建后端应用的工作负载,且带有app=backend的标签,您可以通过该标签进行工作负载亲和/反亲和调度,将新创建的前端应用(标签为app=