检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在执行下述命令之前您需要先通过kubectl连接集群,具体操作请参见通过kubectl连接集群。
容器中查看cuda的版本,执行如下命令: cat /usr/local/cuda/version.txt 然后查看容器所在节点的nvidia驱动版本支持的cuda版本范围,是否包含容器中的cuda版本。 相关链接 工作负载异常:GPU节点部署服务报错 父主题: 节点运行
执行如下命令手动下载镜像。 ctr -n k8s.io images pull --user u:p images 使用新下载的镜像重新创建工作负载。 父主题: 其他
/spark/build 执行如下命令进行编译。 .
通过kubectl命令行动态创建SFS Turbo子目录 使用kubectl连接集群。 创建pvc-sfsturbo-subpath.yaml文件。
利用以下命令进入创建的工作负载,Ctrl+d可退出当前负载。
使用以下命令为Pod加压,其中<service_ip>为Pod关联的Service IP。 # 您需要在节点上下载并安装wrk工具 # 在Apache配置中开启了Gzip压缩模块, 用于模拟服务端处理请求的计算逻辑。 # 执行加压命令, 需注意修改目标应用的IP地址。
Drainage资源名称可以使用kubectl get drainages命令查询。 使用PATCH请求方法,并设置请求Header参数。
执行以下命令,查看已创建的Pod。
执行如下命令,配置名为“sfs-deployment-example.yaml”的创建Pod的yaml文件。
登录服务器,执行如下命令完成CCE组件和LVM数据的清理。 将如下脚本写入clean.sh文件。
前往集群控制台或执行以下kubectl命令删除集群中的test-nginx工作负载。此处仅为示例,请根据实际报错信息进行删除。 kubectl delete deploy test-nginx -n default 解决资源冲突后,尝试重新安装模板。 父主题: 模板插件
42 节点Sudo检查异常处理 检查当前节点sudo命令,sudo相关文件是否正常。 43 节点关键命令检查异常处理 检查节点升级依赖的一些关键命令是否能正常执行。
登录一台可连接公网的Linux虚拟机,且要求可执行Docker命令。 创建一个nginx.conf文件,如下所示,在http下添加server配置即可让nginx提供对外访问的监控数据的接口。
通过kubectl命令行动态创建SFS子目录 使用kubectl连接集群。 创建pvc-sfs-subpath.yaml文件。
这些指标可以直接被用户访问,比如用kubectl top命令,也可以被HPA或者CustomedHPA使用,根据资源使用率使负载弹性伸缩。
Working directory(工作目录):默认为/home/jenkins/agent Command to run(运行的命令)/Arguments to pass to the command(命令参数):需要删除已有的默认值,保持空值。
cd /home mkdir -p $HOME/.kube mv -f kubeconfig.yaml $HOME/.kube/config 执行kubectl命令验证集群的连通性。 以查看集群信息为例,执行以下命令。
kubectl create -f deployment.yaml 命令行终端显示如下类似信息: deployment.apps/mysql created 在工作负载运行的节点上查询创建的docker容器。
执行以下命令,查看已创建的Pod。