检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
访问服务端所在节点IP+NodePort — 正常访问 访问非服务端所在节点IP+NodePort — 无法访问 访问服务端所在节点IP+NodePort — 正常访问 访问非服务端所在节点IP+NodePort — 无法访问 访问服务端所在节点IP+NodePort — 正常访问 访问非服务端所在节点IP+NodePort
一个好的Liveness Probe应该检查应用内部所有关键部分是否健康,并使用一个专有的URL访问,例如/health,当访问/health 时执行这个功能,然后返回对应结果。这里要注意不能做鉴权,不然probe就会一直失败导致陷入重启的死循环。 另外检查只能限制在应用内部,不能检查依赖外部的部分,例如当前端web
获取集群升级前检查任务详情 功能介绍 获取集群升级前检查任务详情,任务ID由调用集群检查API后从响应体中uid字段获取。 调用方法 请参见如何调用API。 URI GET /api/v3/projects/{project_id}/clusters/{cluster_id}/o
Kubernetes虽然不负责搭建网络模型,但要求集群网络满足以下要求: Pod能够互相通信,且Pod必须通过非NAT网络连接,即收到的数据包的源IP就是发送数据包Pod的IP。 节点之间可以在非NAT网络地址转换的情况下通信。 Pod通信 同一个节点中的Pod通信 Pod通过虚拟Ethernet接口对(Veth
优先级函数评分相加。最终,调度器会将Pod调度到总分最大的节点上。 - 标签名 设置节点亲和性时,填写需要匹配的节点标签。 该标签可以使用系统默认的标签,也可以使用自定义标签。 gpu 操作符 可以设置六种匹配关系(In、NotIn、Exists、DoesNotExist、Gt、Lt)。
service)]}{.metadata.name}{"\n"}{end}' 若返回值非空,说明存在聚合API Server。 漏洞修复方案 除了升级之外,当前没有直接可用的缓解措施。集群管理员应注意控制权限,防止非受信人员通过APIService接口部署和控制聚合API Server。 该漏洞已在v1
公平调度(DRF) DRF(Dominant Resource Fairness)是主资源公平调度策略,应用于大批量提交AI训练和大数据作业的场景,可增强集群业务的吞吐量,整体缩短业务执行时间,提高训练性能。 前提条件 已创建v1.19及以上版本的集群,详情请参见购买Standard/Turbo集群。
16-r50、v1.21.11-r10、v1.23.9-r10、v1.25.4-r10、v1.27.1-r10及以上版本的集群。 子用户(非管理员)操作 非管理员的子用户仅支持吊销自身的集群访问凭证,请参考如下操作。 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“总览”,
Running 0 39s Jenkins中验证权限是否符合预期 添加有权限控制的kubeconfig到Jenkins系统中 启动Jenkins任务,部署到namespace default失败,部署到namespace dev成功。 场景二:基于具体资源的权限控制
Service删除时对于ELB的自动删除策略如下: 对于Service自动创建的ELB: 如果该ELB未被其他Service使用,则删除原Service时系统会自动删除对应的ELB。 如果其他Service也关联了该ELB,则删除原Service时不会删除对应的ELB。 Service选择已有的
出规则(Egress):v1.23及以上集群版本。 不支持对IPv6地址网络隔离。 通过原地升级到支持Egress的集群版本,由于不会升级节点操作系统,会导致无法使用Egress,此种情况下,请重置节点。 通过YAML使用Ingress规则 场景一:通过网络策略限制Pod只能被带有特定标签的Pod访问
网IP,享有高性能。 不同容器网络模型,容器网络的性能、组网规模、适用场景各不相同,在容器网络模型对比章节,将会详细介绍不同容器网络模型的功能特性,了解这些有助于您选择容器网络模型。 服务网络 服务(Service)是Kubernetes内的概念,每个Service都有一个固定的
获取集群升级前检查任务详情列表 功能介绍 获取集群升级前检查任务详情列表 调用方法 请参见如何调用API。 URI GET /api/v3/projects/{project_id}/clusters/{cluster_id}/operation/precheck/tasks 表1
如何避免节点上的某个容器被驱逐? 为什么Pod在节点不是均匀分布? 如何驱逐节点上的所有Pod? 如何查看Pod是否使用CPU绑核? 节点关机后Pod不重新调度 如何避免非GPU/NPU负载调度到GPU/NPU节点? 为什么Pod调度不到某个节点上? 修改kubelet参数导致已驱逐的Pod被重新调度 根据GPU/NPU卡信息定位使用该卡的Pod
nginx_ingress_controller_requests的指标为应用配置HPA策略,可以实现随着流量的变化动态调整Pod实例数的功能,优化资源利用率。 前提条件 集群中已安装NGINX Ingress控制器插件。 集群中已安装云原生监控插件(部署模式需要选择“本地数据存储”)。
eus实例,具体操作步骤请参见Prometheus Operator。 由于Prometheus(停止维护)插件版本已停止演进,不再支持该功能特性,请避免使用。 使用kubectl连接集群。 修改Prometheus的ClusterRole。 kubectl edit ClusterRole
作负载。 v1.27及以下的集群中,使用GPU虚拟化后,不支持使用Autoscaler插件自动扩缩容GPU虚拟化节点。 XGPU服务的隔离功能不支持以UVM的方式申请显存,即调用CUDA API cudaMallocManaged(),更多信息,请参见NVIDIA官方文档。请使用
集群升级前检查 功能介绍 集群升级前检查 调用方法 请参见如何调用API。 URI POST /api/v3/projects/{project_id}/clusters/{cluster_id}/operation/precheck 表1 路径参数 参数 是否必选 参数类型 描述
本文以Nginx为例采集监控数据,Nginx本身有个名叫ngx_http_stub_status_module的模块,这个模块提供了基本的监控功能,通过在nginx.conf的配置可以提供一个对外访问Nginx监控数据的接口。 登录一台可连接公网的Linux虚拟机,且要求可执行Docker命令。
RBAC授权方法。 前提条件 本文所述方法仅在v1.11.7-r2及以上版本集群上生效,因为只有v1.11.7-r2及以上版本集群开启了RBAC功能。 创建IAM用户和用户组 使用账号登录IAM,在IAM中创建一个名为user-example的IAM用户和名为cce-role-grou