检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权。 408 Request Time-out 服务器等候请求时发生超时。 客户端可以随时再次提交该请求而无需进行任何更改。 409 Conflict 服务器在完成请求时发生冲突。 返回该状态码,表明客户端尝试创建的资源已经存在,或者由于冲突请求的更新操作不能被完成。
ort为服务暴露出去的端口,--type为服务类型,--target-port为服务对应后端Pod的端口,port提供了集群内部访问服务的入口,即ClusterIP:port。 run 在集群中运行一个特定的镜像。 例如: kubectl run <deployname> --image=nginx:latest
迁移后验证 迁移完成后,您可在Grafana或AOM上查看您的指标。若指标或标签不符合您的预期,您可提交工单联系技术支持寻求帮助。 若您的配置非常复杂,难以判断如何迁移配置,您可提交工单联系技术支持支撑您的迁移动作。 父主题: 可观测性最佳实践
个IP地址和端口号下对外提供多个基于TLS的访问域名,且不同的域名可以使用不同的安全证书。开启SNI后,允许客户端在发起TLS握手请求时就提交请求的域名信息。负载均衡收到TLS请求后,会根据请求的域名去查找证书:若找到域名对应的证书,则返回该证书认证鉴权;否则,返回缺省证书(服务器证书)认证鉴权。
--admission-control=MutatingAdmissionWebhook,ValidatingAdmissionWebhook 如未开启,需要提交工单申请开启。 开启admissionWebhook特性后,如需卸载重装Nginx Ingress Controller,会有Secret残留,需要手动清理。
管理成本和未被分配成本,在其关联的部门中进行平均分摊。支持修改分摊比例。 图5 分摊公共成本 基于部门进行成本管理:部门配置完成后,单击“提交配置”,便可以在部门管理界面看到配置的结果。部门配置结果如下: 图6 部门配置 开通单集群视角的成本洞察 登录CCE控制台,单击集群名称进入集群。
节点池亲和性调度 如何减少节点资源碎片,提高集群资源利用率 集群中存在大作业(request资源量较大)和小作业(request资源量较少)混合提交并运行,希望小作业可以优先填满集群各节点的资源碎片,将空闲的节点资源优先预留给大作业运行,避免大作业由于节点资源不足长时间无法调度。 开启
{image} workingDir: /opt restartPolicy: OnFailure 提交作业,开始训练。 kubectl apply -f mnist.yaml 等待训练作业完成,通过Kubeflow的UI可以查询训练结果信息
级。比如对核心业务和在线业务设置高优先级,可以保证该类业务优先获取集群资源。当集群资源被非核心业务占用,整体资源不足时,如果有新的核心业务提交部署请求,可以通过抢占的方式驱逐部分非核心业务,释放集群资源用于核心业务的调度运行。 CCE集群支持的优先级调度如表1所示。 表1 业务优先级保障调度
使用Nginx Ingress实现灰度发布的集群,需安装nginx-ingress插件作为Ingress Controller,并且对外暴露统一的流量入口。详细操作可参考安装插件。 已上传Nginx镜像至容器镜像服务。为方便观测流量切分效果,Nginx镜像包含新旧两个版本,欢迎页分别为“Old
公平调度(DRF) DRF(Dominant Resource Fairness)是主资源公平调度策略,可以支持多种类型资源的公平分配,应用于大批量提交AI训练和大数据作业场景。DRF调度算法优先考虑集群中业务的吞吐量,适用单次AI训练、单次大数据计算以及查询等批处理小业务场景。 启用公平
为集群管理面绑定公网IP,以支持从公网调用集群接口 配置建议: 对于有通过公网访问集群API的用户,可以按需为集群绑定公网IP 绑定公网IP后集群访问入口将暴露在公网,请谨慎操作 容器网络固定IP池掩码位数 容器网络固定IP池掩码位数,仅vpc-router网络支持。 该参数决定节点可分配容
(deleteAgency) 的事件,事件对应的资源 ID 分别是已删除用户、已删除委托账号的 ID。 如果使用上述方式均无法获取到所需 ID,请提交工单联系运维人员处理。 调用方法 请参见如何调用API。 URI POST /api/v3/projects/{project_id}/c
} } } } 单击保存后,完成整个项目的配置。 持续构建和部署 修改本地代码中的内容,进行提交,触发编译。 git add . && git commit -m "add template" && git push 切回 Jenkins
- 高级设置 - 数据存储 - 云存储。 卸载老存储,同时添加CSI格式的PVC的云存储,容器内挂载路径和以前保持一致,实现存储迁移。 单击提交,确认后升级生效。 等待pod running。 升级使用已有存储的有状态应用 通过kubectl create -f的形式创建pv和pvc
- 高级设置 - 数据存储 - 云存储。 卸载老存储,同时添加CSI格式的PVC的云存储,容器内挂载路径和以前保持一致,实现存储迁移。 单击提交,确认后升级生效。 等待pod running。 升级使用已有存储的有状态应用 通过kubectl create -f的形式创建pv和pvc
实现普罗指标数据的持久化存储。 本地数据存储开启模式 Container thanosQuery 仅在高可用模式下部署。PromQL查询的入口,能够对来自Store或Prometheus的相同指标进行重复数据删除。 本地数据存储开启模式 Deployment adapter (负
”。 请根据业务需求进行工作负载的升级,参数设置方法与创建工作负载时一致。 更新完成后,单击“升级工作负载”,并手动确认YAML文件差异后提交升级。 编辑YAML 可通过在线YAML编辑窗对无状态工作负载、有状态工作负载、守护进程集、定时任务和容器组的YAML文件进行修改和下载。
服务器ID,从ECS/BMS控制台获取。 响应参数 状态码: 200 表5 响应Body参数 参数 参数类型 描述 jobid String 提交任务成功后返回的任务ID,用户可以使用该ID对任务执行情况进行查询。 请求示例 自定义节点池纳管节点 POST /api/v3/proje
在Pod中访问不通的排查思路 若在Pod中出现访问网络不通的情况,可以参考表2 在Pod中访问不通具体排查思路进行排查。如果以下思路均不能解决您的问题,请提交工单联系华为云客服为您解答。 表2 在Pod中访问不通具体排查思路 排查路径 问题 解决方案 被访问的服务安全组规则 在该部分可能存在以下问题: