检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
方式为软约束,CPU真实负载阈值和内存真实负载阈值使用默认值80。 希望优先确保工作负载的稳定性,降低热点节点CPU、内存压力的场景:可以设置真实负载阈值生效方式为硬约束,CPU真实负载阈值和内存真实负载阈值在60~80之间设置。 配置案例2 随着集群状态,工作负载流量与请求的动
插件名称,固定为:customedhpa-controller requestsCpu 是 String 申请的CPU大小,单位:m requestsMem 是 String 申请的内存大小,单位:Mi 表5 tolerations污点 参数 是否必选 参数类型 描述 key 否 String
{ }, "multiAZEnabled" : false, "over_subscription" : "80", "project_id" : "*****", "volume_attaching_flow_ctrl"
400 CCE.01400014 Excessive nodes in the cluster. 节点数超出集群规模限制。 请提交工单申请变更集群规格。 400 CCE.01400015 Version not supported. 不受支持的集群版本。 请参考返回的message,创建支持的集群版本。
service.name。 数值表示的后端 servicePort 字段被更名为 service.port.number。 字符串表示的后端 servicePort 字段被更名为 service.port.name。 对所有要指定的路径,pathType 都成为必需字段。 可选项为 Prefix、Exact
详情请参见更新指定节点池。 情况二:您需要登录CCE控制台,在集群的“配置中心”页面修改“节点默认安全组”。新增的节点安全组需要满足集群端口通信规则,详情请参见集群安全组规则配置。 节点池指定的企业项目被删除 当扩容节点池失败时,事件中包含创建节点失败的错误,错误信息如下: The
g.apache.spark.deploy.history.HistoryServer-1-spark-sh1.out 启动后可以通过节点端口18080访问。 如需关闭history server,可执行以下脚本: stop-history-server.sh 父主题: 在CCE集群中部署使用Spark
String 插件名称,固定为:metrics-server requestsCpu 是 String 申请的CPU大小,单位:m requestsMem 是 String 申请的内存大小,单位:Mi 表5 tolerations污点 参数 是否必选 参数类型 描述 key 否 String
'-c', 'sysctl -w net.core.somaxconn=65535;sysctl -w net.ipv4.ip_local_port_range="1024 65535"'] extraVolumeMounts: # 挂载节点上的/etc/localtime文件,进行时区同步
FROM nginx:1.21.5-alpine ADD nginx.conf /etc/nginx/nginx.conf EXPOSE 80 CMD ["nginx", "-g", "daemon off;"] 使用上面Dockerfile构建镜像并上传到SWR镜像仓库,镜像名
cpu: 1 memory: 100Mi ports: - containerPort: 80 同时,Volcano还支持设置负载所属队列和抢占属性等,可通过Pod的注解实现。目前Volcano支持的Pod注解配置如下: 表1 Volcano支持的Pod注解
连接至您的Master节点。 6 节点池检查异常处理 检查节点池状态是否正常。 7 安全组检查异常处理 检查Node节点安全组规则中,协议端口为ICMP:全部,源地址为Master节点安全组的规则是否被删除。 8 残留待迁移节点检查异常处理 检查节点是否需要迁移。 9 K8s废弃资源检查异常处理
NodeEIPSpec 参数 是否必选 参数类型 描述 iptype 是 String 参数解释: 弹性IP类型,取值请参见申请EIP接口中publicip.type说明。 链接请参见申请EIP。 约束限制: 不涉及 取值范围: 不涉及 默认取值: 不涉及 bandwidth 否 NodeBandwidth
"clusterVersion" : "v1.15.11-r1", "targetVersion" : "v1.19.16-r80", "skippedCheckItemList" : [ ] } } 响应示例 状态码: 200 执行集群升级前检查成功。 {
作为监控目标。 prometheus.io/path:采集的url,默认为/metrics。 prometheus.io/port:采集endpoint的端口号。 prometheus.io/scheme:默认为http,如果为了安全设置了https,此处需要改为https。 使用kubectl连接集群。
插件名称,固定为:npu-driver-installer requestsCpu 是 String 申请的CPU大小,单位:m 默认为:50m requestsMem 是 String 申请的内存大小,单位:Mi 默认为:100Mi 请求示例 { "kind": "Addon",
然后查看Deployment和Service,发现没有权限;再查询kube-system命名空间下的Pod,发现也没有权限。这就说明IAM用户user-example仅拥有defaul这个命名空间下GET和LIST Pod的权限,与前面定义的没有偏差。 # kubectl get deploy
String 模板名称,固定为:custom-resources requestsCpu 是 String 申请的CPU大小,单位:m requestsMem 是 String 申请的内存大小,单位:Mi 表5 npc字段数据结构说明 参数 是否必选 参数类型 描述 maxTaintedNode
型Pod会最先被终止。 Burstable类型的Pod:系统用完了全部内存,且没有BestEffort容器可以终止时,该类型Pod会被终止。 Guaranteed类型的Pod:系统用完了全部内存、且没有Burstable与BestEffort容器可以终止时,该类型的Pod会被终止。
的Pod会自动删除。 容器无响应:如果Pod中的容器在终止过程中没有响应SIGTERM信号,则可能导致Pod卡在Terminating状态。 Pod中存在未处理完的请求或资源占用:如果Pod中存在长时间运行的进程没有结束,则可能导致Pod无法被正常终止,进入Terminating状态。