检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
当前检查项仅1.16.0及以上版本支持。 NPD的检查项主要分为事件类检查项和状态类检查项。 事件类检查项 对于事件类检查项,当问题发生时,NPD会向APIServer上报一条事件,事件类型分为Normal(正常事件)和Warning(异常事件) 表2 事件类检查项 故障检查项 功能 说明 OOMKilling
的步骤进行验证。 通过kubectl命令行使用已有对象存储 使用kubectl连接集群。 创建PV。 创建pv-obs.yaml文件。 apiVersion: v1 kind: PersistentVolume metadata: annotations: pv.kubernetes
使用kubectl自动创建云硬盘存储 使用kubectl连接集群。 使用StorageClass动态创建PVC及PV。 创建pvc-evs-auto.yaml文件。 apiVersion: v1 kind: PersistentVolumeClaim metadata: name: pvc-evs-auto
您可以在不同的隔离模式中应用不同的策略,由于Pod安全性准入能力是在命名空间(Namespace)级别实现的,因此假设某个Namespace配置如下: apiVersion: v1 kind: Namespace metadata: name: my-baseline-namespace
使用kubectl自动创建文件存储 使用kubectl连接集群。 使用StorageClass动态创建PVC及PV。 创建pvc-sfs-auto.yaml文件。 apiVersion: v1 kind: PersistentVolumeClaim metadata: name: pvc-sfs-auto
单击“创建”。等待job执行完成,进入OBS页面,可以查看到以图片形式展示的执行结果。 通过kubectl创建可以按如下YAML执行。 kind: Job apiVersion: batch/v1 metadata: name: testjob namespace: default spec:
在集群中创建一个Deployment。 创建deployment.yaml文件,文件内容示例如下: kind: Deployment apiVersion: apps/v1 metadata: name: example namespace: default spec:
回显的字符串即为kubeconfig.json的内容。 project:项目名称。 登录管理控制台,将鼠标移至右上角您的用户名处,单击“我的凭证”。在“API凭证”的项目列表中查找当前区域对应的项目。 swr_ak:密钥的AK。 登录管理控制台,将鼠标移至右上角您的用户名处,单击“我的凭证”。在
存活探测情况下的放弃就意味着重新启动容器。就绪探测情况下的放弃 Pod 会被打上未就绪的标签。 默认值是 3,最小值是 1。 YAML示例 apiVersion: v1 kind: Pod metadata: labels: test: liveness name: liveness-http
topology.kubernetes.io/zone进行优先级排序,尽量将Pod调度至可用区az1的节点上。设置节点亲和性示例如下: apiVersion: apps/v1 kind: Deployment metadata: name: gpu labels:
podAffinity字段来设置工作负载亲和性,将前端Pod(标签为app=frontend)和后端Pod(标签为app=backend)部署在一起。 apiVersion: apps/v1 kind: Deployment metadata: name: frontend labels:
版本实例上,然后手动继续更新,最后在升级的剩余时间内逐渐自动增大流量。 创建一个rollout-canary.yaml文件,示例如下: apiVersion: argoproj.io/v1alpha1 kind: Rollout metadata: name: rollout-canary
t)和节点动态预热容器网卡数(nic-warm-target)两个参数配置,且不支持节点池级别的差异化配置。 请通过console页面或API修改容器网卡动态预热参数配置,请勿直接后台修改节点annotations上对应的容器网卡动态预热参数,集群升级后,后台直接修改的annotations会被覆盖为原始的值。
以下示例为创建一个名为nginx的Deployment负载,使用nginx:latest镜像创建两个Pod,每个Pod占用100m CPU、200Mi内存。 apiVersion: apps/v1 # 注意这里与Pod的区别,Deployment是apps/v1而不是v1 kind: Deployment
webhook。kruise-controller-manager会创建webhook configurations来配置哪些资源需要感知处理,并为kube-apiserver提供可调用的Service。 Deployment kruise-daemon 通过DaemonSet部署到每个节点上,提供镜像预热、容器重启等功能。
启驱动选择时,如从控制台创建NPU节点,控制台会自动补充NPU驱动(用户无法指定版本和类型)安装命令,并在安装完成后自动重启节点;如通过API或其他方式创建节点则需要用户在“安装后执行脚本”中添加驱动安装命令。 支持的NPU卡类型和对应的操作系统规格如下: NPU卡类型 支持的操作系统
v1.21 v1.23 v1.25 v1.27 支持xGPU设备监控 支持nvidia.com/gpu与volcano.sh/gpu-* api兼容 2.0.5 v1.19 v1.21 v1.23 v1.25 - 2.0.0 v1.19 v1.21 v1.23 v1.25 支持GPU虚拟化
若集群内存在其他正常节点,可通过ping命令检查跨节点容器之间的网络连通性。 创建一个测试容器,示例如下,其中{node_ip}为该异常节点的IP。 kind: Pod apiVersion: v1 metadata: name: nginx namespace: default spec: containers: