检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在“AI任务性能增强调度”配置中,选择是否开启“公平调度 (drf) ”。 启用该能力后,可增强集群业务的吞吐量,提高业务运行性能。 修改完成后,单击“确认配置”。 父主题: AI任务性能增强调度
ring命名空间下的PVC(名称中含有prometheus-server的PVC)。 采集配置迁移 迁移prometheus配置 若您从未修改过monitoring命名空间下名为prometheus的ConfigMap,则无需关注本步骤。 执行以下命令,备份prometheus。
性IP。 创建Service后,如果服务亲和从集群级别切换为节点级别,连接跟踪表将不会被清理,建议用户创建Service后不要修改服务亲和属性,如需修改请重新创建Service。 CCE Turbo集群中,仅当Service的后端对接使用主机网络(HostNetwork)的Pod时,亲和级别支持配置为节点级别。
etheus监控数据采集说明。 ICAgent仅支持上报Gauge指标类型的指标。 ICAgent调用自定义指标的接口周期为1分钟,不支持修改。 Prometheus监控数据采集说明 Prometheus通过周期性的调用应用程序的监控指标接口(默认为“/metrics”)获取监控
费用账单 您可以在“费用中心 > 账单管理”查看资源的费用账单,以了解该资源在某个时间段的使用量和计费信息。 账单上报周期 包年/包月计费模式的资源完成支付后,会实时上报一条账单到计费系统进行结算。 按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据
已安装插件时:单击“管理”,找到已安装的插件实例,单击右侧“编辑”,在参数配置中找到“日志采集”并开启。 如果集群中安装了多个NGINX Ingress控制器,需修改每个插件实例的配置才可采集所有实例的日志。 未安装插件时:单击“安装”,在参数配置中找到“日志采集”并开启。其余参数请根据需求选择,配置说明请参见NGINX
点池生效。当前页面仅支持查看集群级别的弹性伸缩策略,如需修改请前往“配置中心”进行设置,详情请参见配置集群弹性伸缩策略。 设置完成后,单击“确定”。 配置集群弹性伸缩策略 集群弹性伸缩策略对集群下的所有节点池都会生效,且修改后会重启autoscaler插件。 登录CCE控制台,单击集群名称进入集群详情页。
指定Access-Control-Expose-Headers响应头的值,表示可以被跨域请求读取的自定义响应头部,例如通过客户端的JavaScript代码获取非标准响应头字段。可填写多个值,以英文逗号分隔。 kubernetes.io/elb.cors-expose-headers: 'fake-header-2'
manager有状态负载的yaml可以看到告警数据存放在Pod磁盘中,如果Pod重启,告警数据就会消失。如需要持久化,请规划一个PVC,并修改alertmanager的CR资源,挂载PVC。 父主题: 可观测性最佳实践
cd /opt/cloud/cce/nvidia/bin && ./nvidia-smi # 插件版本为2.0.0及以上时,驱动安装路径更改,需执行以下命令: cd /usr/local/nvidia/bin && ./nvidia-smi 登录CCE控制台,单击集群名称进入集群,在左侧选择“配置中心”。
所在节点异常时可能导致插件功能无法正常使用,请谨慎选择。 容器 选择“自定义”规格时,您可根据需求调整插件实例的容器规格。 选择需要修改的配置,修改参数值。详情请参见社区参数说明。 设置插件实例的部署策略。 调度策略对于DaemonSet类型的插件实例不会生效。 设置多可用区部署
大规模三控制节点CCE集群(最大1000节点) cce.s2.xlarge: 超大规模三控制节点CCE集群(最大2000节点) 说明: 关于规格参数中的字段说明如下: s1:单控制节点的集群,控制节点数为1。单控制节点故障后,集群将不可用,但已运行工作负载不受影响。 s2:三控制节点的集群,即
EulerOS。 存量节点池 将CentOS操作系统切换为支持切换的操作系统。如果现有的节点配置(VPC、磁盘等配置的类型和数量)都不需要改变,仅需要修改节点的操作系统镜像,并且您的软件和原操作系统耦合度较低,建议使用重置节点的功能进行系统切换。 在集群控制台左侧导航栏中选择“节点管理”,切换至“节点池”页签。
Mapper作为存储驱动的节点。 详细限制说明请参见CCE接入 > 约束限制。 每个工作负载需单独配置。 日志采集策略与Pod配置耦合,修改日志配置会重启Pod。 日志采集策略与工作负载分开配置,调整日志采集策略不影响Pod运行。 可以指定采集某个容器的日志。 采集容器文件日志时,若节点存储模式为Device
本功能方便快捷地创建、管理和销毁节点,而不会影响整个集群。新节点池中所有节点的参数和类型都彼此相同,您无法在节点池中配置单个节点,任何配置更改都会影响节点池中的所有节点。 通过节点池功能您还可以实现节点的动态扩缩容(仅按需计费的节点池支持): 当集群中出现因资源不足而无法调度的实
休眠/唤醒按需计费集群 操作场景 当按需计费的集群暂时不需要使用时,您可以将其设置为休眠状态,有助于节省成本并减少资源浪费。 集群休眠后,将无法在此集群上创建和管理工作负载等资源。 注意事项 集群唤醒过程中,可能会由于资源不足导致Master节点启动失败,从而导致集群唤醒失败,请过一段时间再次唤醒。
登录CCE控制台,进入一个已有的集群,在左侧导航栏中选择“日志中心”。 选择“控制面组件日志”页签,单击右上角“配置控制面组件日志”,在“配置控制面组件日志”中修改日志配置。 图5 关闭控制面组件日志 选择是否开启各个组件日志,并单击“确定”。 关闭集群控制面组件日志后,原有的日志流将不再更新日志,但
以下pipeline脚本仅供您参考,您可根据自身业务自定义脚本内容,关于更多关于流水线脚本的语法请参考Pipeline。 示例脚本中的部分参数需要修改: git_url:您代码仓库的地址,需要替换为实际取值。 swr_login:登录命令为获取长期的docker login命令获取的命令。
在左侧导航栏中选择“配置中心”。 在“集群访问配置”中,将“开启过载防护(support-overload)”设置为关闭状态。 单击“确定”保存修改。 父主题: 管理集群
污点配置时需要配合Pod的toleration使用,否则可能导致扩容失败或者Pod无法调度到扩容节点。 节点池创建后可单击列表项的“编辑”修改配置,修改后将同步到节点池下的已有节点。 最大实例数 节点最大可以正常运行的实例数(Pod),该数量包含系统默认实例,取值范围为16~256。