检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
hpa-example:latest . (可选)登录SWR管理控制台,选择左侧导航栏的“组织管理”,单击页面右上角的“创建组织”,创建一个组织。 如已有组织可跳过此步骤。 在左侧导航栏选择“我的镜像”,单击右侧“客户端上传”,在弹出的页面中单击“生成临时登录指令”,单击复制登录指令。 在集群节点上执行上
节点(ECS)进行域名解析,也说明已完成该设置,如下图: 但是在容器内进行解析却提示bad address无法解析域名返回地址,如下图: 登录CCE控制台查看该集群的插件安装情况。 如果已安装插件列表中没有coredns插件,可能是用户卸载了该插件等原因导致。 安装coredns
击“更多>开启节点缩容保护”,然后再进行转包年/包月操作。 如果您在购买按需计费的节点后,想更换为包年/包月计费,可按如下步骤进行操作: 登录CCE控制台,单击集群名称进入集群。 在左侧选择节点管理,在节点的操作列选择“更多 > 转包年包月”。 图1 按需节点转包年/包月 单击“确定”,等待生成订单并完成支付即可。
资源准备 在集群中添加GPU节点 登录CCE控制台,单击已创建的集群,进入集群控制台。 安装GPU插件。 在左侧导航栏中选择“插件管理”,在右侧找到gpu-beta(或gpu-device-plugin),单击“安装”。 在安装插件页面,设置插件关键参数。 Nvidia驱动:填写
手动扩容策略 当节点池进行手动扩缩容时,您可选择指定的规格进行伸缩。当选择的节点规格资源不足或配额不足时,会导致扩容失败。 设置优先级 关于如何设置节点池规格优先级详情请参见配置集群弹性伸缩策略。 父主题: 节点弹性伸缩
通过动态存储卷使用专属存储:即动态创建的方式,无需预先创建磁盘,在创建PVC时通过指定存储类(StorageClass),即可自动创建磁盘和对应的PV对象。适用于无可用的磁盘,需要新创建的场景。 在有状态负载中动态挂载专属存储:仅有状态工作负载支持,可以为每一个Pod关联一个独有的PVC及P
弹性场景,支持分钟级的负载发现与计费能力,让所有成本无一遗漏。 约束与限制 PVC存储费用:当前只统计云硬盘(EVS)类型存储费用,不支持对象存储类型(OBS)、本地持久卷、文件存储类型(SFS)、极速文件存储(SFS Turbo)。 节点成本按照CPU、内存进行成本拆分,暂不支
eus,详情请参见Installation。 操作步骤 分别获取目标集群的bearer_token 信息。 在目标集群创建rbac权限。 登录到目标集群后台节点,创建prometheus_rbac.yaml文件。 apiVersion: v1 kind: ServiceAccount
terIP)或节点访问(NodePort)配置示例Service。 添加Nginx Ingress 请参见通过kubectl连接集群,使用kubectl连接集群。 创建名为“ingress-test.yaml”的YAML文件,此处文件名可自定义。 vi ingress-test.yaml
载修改为其他工作负载。 AHPA策略不支持和CustomedHPA策略同时启用。 使用AHPA策略 使用kubectl连接集群,详情请参见通过kubectl连接集群。 部署一个示例工作负载。如果已有工作负载可忽略本步骤。推荐使用已收集超过7天以上监控数据的工作负载,AHPA生效需要7天或更久的监控数据。
击“更多>开启节点缩容保护”,然后再进行转包年/包月操作。 如果您在购买按需计费的节点后,想更换为包年/包月计费,可按如下步骤进行操作: 登录CCE控制台,单击集群名称进入集群。 在左侧选择节点管理,在节点的操作列选择“更多 > 转包年包月”。 图1 按需节点转包年/包月 单击“确定”,等待生成订单并完成支付即可。
hpa-example:latest . (可选)登录SWR管理控制台,选择左侧导航栏的“组织管理”,单击页面右上角的“创建组织”,创建一个组织。 如已有组织可跳过此步骤。 在左侧导航栏选择“我的镜像”,单击右侧“客户端上传”,在弹出的页面中单击“生成临时登录指令”,单击复制登录指令。 在集群节点上执行上
是 String 参数解释: 项目ID,获取方式请参见如何获取接口URI中参数。 约束限制: 不涉及 取值范围: 账号的项目ID 默认取值: 不涉及 cluster_id 是 String 参数解释: 集群ID,获取方式请参见如何获取接口URI中参数。 约束限制: 不涉及 取值范围:
更好地满足业务需求。 场景分类 相关最佳实践 创建节点池相关实践 制作CCE节点自定义镜像 创建节点时执行安装前/后脚本 创建节点时使用OBS桶实现自定义脚本注入 选择合适的节点数据盘大小 节点池日常管理实践 存储扩容 通过Core Dump文件定位容器问题 容器与节点时区同步
nameservers 无 无 允许 - 搜索域 参数名 取值范围 默认值 是否允许修改 作用范围 dnsConfig.searches 无 无 允许 - 可选对象 参数名 取值范围 默认值 是否允许修改 作用范围 dnsConfig.options 无 无 允许 - 父主题: Pod
fs(常见的nfs类型有obsfs、sfs等),且节点与远端nfs服务器断连,导致挂载点失效,所有访问该挂载点的进程均会出现D状态卡死。 登录节点。 在节点上新建一个脚本文件(例如/tmp/check_hang_mount.sh),脚本文件内容如下: for mount_path
扩缩容节点池 您可指定节点池中的某个规格进行扩缩容。 默认节点池不支持扩缩容,请通过创建节点添加。 登录CCE控制台。 单击集群名称进入集群,在左侧选择“节点管理”,在右侧选择“节点池”页签。 单击节点池名称后的“扩缩容”。 在弹出的“节点池扩缩容”窗口中,设置扩缩容参数。 扩缩容:选择“扩容节点”或“缩容节点”。
节点池亲和性调度(nodepoolaffinity) nodepoolaffinity.weight 节点池亲和调度,开启后默认是 10000 节点池亲和性调度 如何减少节点资源碎片,提高集群资源利用率 集群中存在大作业(request资源量较大)和小作业(request资源量较少)混合提交并运行,希望
检查集群升级后,新建节点是否能新建Pod。 检查步骤 基于新建节点检查创建了新节点后,通过创建DaemonSet类型工作负载,在每个节点上创建Pod。 登录CCE控制台,单击集群名称进入集群。 在导航栏中选择“工作负载”,单击右上角“创建工作负载”或“YAML创建”。创建DaemonSet的操
请参见DCGM-Exporter。 前提条件 集群中已有正常运行的NVIDIA GPU节点。 步骤一:启用DCGM-Exporter组件 登录CCE控制台,单击集群名称进入集群,在左侧导航栏中选择“插件中心”,在右侧找到CCE AI套件(NVIDIA GPU)插件,单击安装。 选