检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
弹性策略”页签,单击要编辑的策略后方的“编辑”。 图3 编辑节点弹性策略 在打开的“编辑节点弹性策略”页面中,参照表2更新策略参数。 完成设置后,单击“确定”按钮完成编辑操作。 克隆节点弹性策略 在CCE控制台,单击集群名称进入集群。 在左侧导航栏中单击“策略”,切换至“节点弹性
件系统卡死问题 IPVS缺陷导致节点上升级CoreDNS后出现概率性解析超时 节点ARP表项超过限制 EulerOS 2.9内核缺陷导致虚拟机卡住 父主题: 节点
置暂不生效。(插件1.3.0及以上版本没有该限制) 如果业务容器的数据目录是通过数据卷(Volume)挂载的,插件不支持采集它的父目录,需设置采集目录为完整的数据目录。 当容器存活时间低于1分钟时,日志无法及时采集,可能存在日志丢失的情况。 费用说明 LTS创建日志组免费,并每月
/dev/vdb Device /dev/vdb excluded by a filter 这是由于添加的磁盘是在另一个虚拟机中新建的,已经存在了分区表,当前虚拟机并不能识别磁盘的分区表,运行parted命令重做分区表,中途需要输入三次命令。 root@host1:~# parted
默认节点池不支持修改混部配置。 云原生混部配置 云原生混部以节点池粒度进行管理,您需要在节点池打开混部开关并进行混部配置。默认的混部配置,会启用混部所有能力并设置默认参数。您可以对默认的混部配置进行修改。 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“节点管理”,单击节点池的“更多 >
持久存储卷”导入存储池,详情请参见创建节点。 手动导入 如果创建节点时没有导入持久存储卷,或当前存储卷容量不够,可以进行手动导入。 前往ECS控制台为节点添加SCSI类型的磁盘。操作步骤详情请参见新增磁盘。 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“存储”,并切换至“存储池”页签。
28集群:v1.28.6-r0及以上版本 v1.29集群:v1.29.2-r0及以上版本 v1.29以上版本集群 通过kubectl命令行设置 创建一个配置安全组的工作负载,最终Pod关联安全组以annotation中的配置为准: 如果Pod已绑定安全组,则会被覆盖。 apiVersion:
节点ID文件检查异常处理 检查项内容 检查节点的ID文件内容是否符合格式。 解决方案 在CCE控制台上的“节点管理”页面,单击异常节点名称进入ECS界面。 复制节点ID,保存到本地。 图1 复制节点ID 登录异常节点,备份文件 。 cp /var/lib/cloud/data/instance-id
metrics.alpha.kubernetes.io/custom-endpoints: '[{"api":"","path":"","port":"","names":""}]' ownerReferences: - apiVersion: apps/v1
r节点,直至新的Containerd节点池中节点数量和原Docker节点池中节点数量一致。 若您在原有Docker节点或节点池上部署的负载设置了对应的节点亲和性,则需要将负载的节点亲和性策略配置为的新Containerd节点或节点池。 迁移完成后,删除原有Docker节点池。 父主题:
储池,详情请参见创建节点。 图1 导入临时卷 手动导入 如果创建节点时没有导入临时存储卷,或当前存储卷容量不够,可以进行手动导入。 前往ECS控制台为节点添加SCSI类型的磁盘。操作步骤详情请参见新增磁盘。 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“存储”,并切换至“存储池”页签。
String 插件下载用户,无需指定 platform 是 String 插件平台,无需指定 escEndpoint 是 String ecs地址,无需指定 表3 flavor 参数 是否必选 参数类型 描述 description 否 String 插件相关的描述信息 name
21 v1.23 v1.25 节点池支持配置GPU驱动版本 支持GPU指标采集 1.2.20 v1.19 v1.21 v1.23 v1.25 设置插件别名为gpu 1.2.17 v1.15 v1.17 v1.19 v1.21 v1.23 增加nvidia-driver-install
DMS UserAccess AOM 支持用户通过 DMS 获取数据订阅的功能,因此需要获得该权限。 AOM ECS CommonOperations AOM 支持通过在 ECS 上安装 UniAgent 和 ICAgent 获取系统指标、日志数据,因此需要获得该权限。 AOM CES
metrics.alpha.kubernetes.io/custom-endpoints: '[{"api":"","path":"","port":"","names":""}]' pod.alpha.kubernetes.io/initialized: 'true'
凭证添加到Jenkins,具体操作请参考设置集群访问凭证。 prod_credential :添加到Jenkins的生产集群凭证,请填写凭证ID。如果需要部署在另一个集群,需要重新将这个集群的访问凭证添加到Jenkins,具体操作请参考设置集群访问凭证。 test_apiserver
credential:添加到Jenkins的集群凭证,请填写凭证ID。如果需要部署在另一个集群,需要重新将这个集群的访问凭证添加到Jenkins,具体操作请参考设置集群访问凭证。 apiserver:部署应用集群的APIserver地址,需保证从Jenkins集群可以正常访问该地址。 //定义代码仓地址
lib64" enable_fault_isolation 否 Bool 默认值:true true:插件识别GPU硬件故障或驱动程序问题,设置GPU卡不可用 enable_health_monitoring 否 Bool 默认值:true true:插件能够识别GPU硬件故障或驱动程序问题
default.gc_thresh3确定,此内核参数非namespace隔离,节点和节点上运行容器会共用ARP表项大小。容器场景下,该参数推荐设置为163790。 此内核参数计算公式如下: CCE Turbo集群&容器隧道网络模型集群: net.ipv4.neigh.default.gc_thresh3
登录CCE控制台,单击集群名称进入集群,单击左侧导航栏的“插件中心”。 在“插件中心”页面右侧找到云原生监控插件,单击“安装”。 建议您关注以下配置,其他配置可按需进行设置。详情请参见云原生监控插件。 数据存储配置:必选本地数据存储,可选监控数据是否对接AOM或三方监控平台。 自定义指标采集:该配置在本实践中