检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Pod事件查看方法 方式一 在CCE控制台中单击工作负载名称,前往“工作负载详情”页面,找到处于异常状态的实例,单击操作栏中的“事件”进行查看。 图1 查看Pod事件 方式二 Pod的事件可以使用kubectl describe pod {pod-name}命令查看, $ kubectl
在侧边栏滑出的“配置管理”窗口中,修改kubelet组件的CPU管理策略配置(cpu-manager-policy)参数值,选择enhanced-static。 图1 CPU管理策略配置 单击“确定”,完成配置操作。 验证 以8U32G节点为例,并提前在集群中部署一个CPU request为1,limit为2的工作负载。
自己定义使用的GPU量,提高GPU利用率。 GPU虚拟化 NPU调度 CCE为集群中的NPU异构资源提供调度能力,实现快速高效地处理推理和图像识别等工作。 功能 描述 参考文档 NPU调度 NPU调度可以指定Pod申请NPU的数量,为工作负载提供NPU资源。 NPU调度 Volcano调度
com/BVLC/caffe/blob/master/examples/00-classification.ipynb 另存链接中里面小猫图片。 data/ilsvrc12/* https://github.com/BVLC/caffe/tree/master/data/ilsvrc12
应用备份能力。同时可以将本地压缩包恢复回Kubernetes元数据,实现应用的恢复能力。 数据备份的流程参考如下: 图1 数据备份流程 数据恢复的流程参考如下: 图2 数据恢复流程 在执行恢复操作前,需要准备一个数据恢复配置文件“restore.json”,目的是在应用恢复时自动
下载并配置kubectl连接集群。 登录CCE控制台,单击集群名称,在集群信息页面查看“连接信息 > kubectl ”,单击“配置”并按照指导配置kubectl。 图1 kubectl 安装Helm 3,具体请参见https://helm.sh/zh/docs/intro/install/。 部署WordPress
程序Pod仍然存在并保持在“已停止”状态,直到最终进行垃圾回收或手动清理。在“已停止”状态下,驱动程序Pod不会使用任何计算或内存资源。 图1 提交机制的工作原理 在CCE上运行SparkPi例子 在执行Spark的机器上安装kubectl,详情请参见通过kubectl连接集群。
pass-through的annotation,可以实现集群内部访问Service的ELB地址时绕出集群,并通过ELB的转发最终转发到后端的Pod。 图1 pass-through访问示例 对于CCE集群: 集群内部客户端访问LB类型Service时,访问请求默认是通过集群服务转发规则(ip
互不重叠的监听端口段。 监听器前端协议:当选择独享型负载均衡器类型时,需包含“网络型(TCP/UDP/TLS)”方可支持配置TLS协议。 图1 配置区间端口监听 配置完成后,单击“确定”。 通过kubectl命令行配置 请参见通过kubectl连接集群,使用kubectl连接集群。
目标服务访问端口:可选择目标Service的访问端口。 域名:无需填写 路径匹配规则:前缀匹配 路径:/ 目标服务名称:nginx 目标服务访问端口:80 图1 配置HTTPS协议的后端服务 配置完成后,单击“确定”。 请参见通过kubectl连接集群,使用kubectl连接集群。 创建名为“ingress-test
RollingUpdate:滚动升级,即逐步创建新Pod再删除旧Pod,为默认策略。 Recreate:替换升级,即先把当前Pod删掉再重新创建Pod。 图1 工作负载升级策略 升级参数说明 参数 说明 限制 最大浪涌(maxSurge) 与spec.replicas相比,可以有多少个Pod存在,默认值是25%。
Token文件。 Pod内程序使用挂载的OIDC Token文件访问IAM获取临时的IAM Token。 Pod内程序使用IAM Token访问云服务。 图1 工作流程 步骤一:获取CCE集群的签名公钥 使用kubectl连接集群。 执行如下命令获取公钥。 kubectl get --raw /openid/v1/jwks
5-r10 v1.21.7 - 增强EulerOS 2.3的裸金属节点在重启后的UDP链接稳定性。 优化隧道网络在控制面节点间网络闪断场景下导网络分配的稳定性。 ovs漏洞加固。 修复部分安全问题。 v1.21.5-r0 v1.21.7 - 增强集群升级下容器隧道网络模式的稳定性。
s_total{instance=~"10.0.0.2:9153"}[5m])) 其中10.0.0.2为CoreDNS容器IP,返回结果如图: 通过控制台获取开源Prometheus监控数据 当集群中的云原生监控插件安装完成后,可通过为Prometheus创建NodePort或L
目标服务访问端口:80 转发规则三: 域名:foo.example.com 路径匹配规则:前缀匹配 路径:/ 目标服务名称:nginx 目标服务访问端口:80 图1 路由到多个服务 配置完成后,单击“确定”。 请参见通过kubectl连接集群,使用kubectl连接集群。 创建名为“ingress-test
目标服务访问端口:可选择目标Service的访问端口。 域名:无需填写 路径匹配规则:前缀匹配 路径:/ 目标服务名称:nginx 目标服务访问端口:80 图1 配置HTTP/2 配置完成后,单击“确定”。 请参见通过kubectl连接集群,使用kubectl连接集群。 创建名为“ingress-test
登录CCE控制台,单击集群名称进入集群,在左侧导航栏中选择“应用模板”,在右上角单击“上传模板”。 单击“添加文件”,选中待上传的模板包后,单击“上传”。 图1 上传模板包 由于上传模板时创建OBS桶的命名规则由cce-charts-{region}-{domain_name}变为cce-char
目标服务访问端口:可选择目标Service的访问端口。 域名:无需填写 路径匹配规则:前缀匹配 路径:/ 目标服务名称:nginx 目标服务访问端口:80 图1 配置gzip数据压缩 单击“确定”,创建Ingress。 请参见通过kubectl连接集群,使用kubectl连接集群。 创建名为“ingress-test
5-r10 v1.21.7 - 增强EulerOS 2.3的裸金属节点在重启后的UDP链接稳定性。 优化隧道网络在控制面节点间网络闪断场景下导网络分配的稳定性。 ovs漏洞加固。 修复部分安全问题。 v1.21.5-r0 v1.21.7 - 增强集群升级下容器隧道网络模式的稳定性。
rometheus发布为外部访问(NodePort类型或LoadBalancer类型),详情请参见使用Prometheus插件监控。 如下图,可以看到GPU节点上的GPU利用率以及其他相关指标,更多GPU指标请参见可观测指标。 登录Grafana页面查看GPU信息 如您安装了Grafana,您可通过导入NVIDIA