检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查询集群日志配置信息 功能介绍 获取集群组件上报的LTS的配置信息 调用方法 请参见如何调用API。 URI GET /api/v3/projects/{project_id}/cluster/{cluster_id}/log-configs 表1 路径参数 参数 是否必选 参数类型
通过PromQL语句查询Prometheus数据 PromQL是Prometheus Query Language的缩写,是一种用于查询和聚合时间序列数据的查询语言。Prometheus是一个开源的监控系统,用于收集和存储时间序列数据,每个时间序列都由一个唯一的标识符和一组时间戳
com+mirrors.huaweicloud.com/docker-ce+' /etc/yum.repos.d/docker-ce.repo 执行以下命令,查看可用的Docker版本。 yum list docker-ce --showduplicates | sort -r 回显结果如下: Loading
查询CCE服务下的资源配额 功能介绍 该API用于查询CCE服务下的资源配额。 调用方法 请参见如何调用API。 URI GET /api/v3/projects/{project_id}/quotas 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
连接集群。工具支持在Linux(x86、ARM)环境中运行,因此您可以任选一种架构的服务器作为操作服务器。该服务器需要至少拥有5GB左右的本地磁盘空间和≥8G的内存,以确保工具可以正常运行,并存储相关数据。 工具获取 在安装了kubectl的服务器上下载以下工具: 工具 说明 下载链接
查询API版本信息列表 功能介绍 该API用于查询CCE服务当前支持的API版本信息列表。 调用方法 请参见如何调用API。 URI GET / 请求参数 无 响应参数 状态码: 200 表1 响应Body参数 参数 参数类型 描述 versions Array of APIVersionDetail
查询指定模板实例历史记录 功能介绍 查询指定模板实例历史记录 调用方法 请参见如何调用API。 URI GET /cce/cam/v3/clusters/{cluster_id}/namespace/{namespace}/releases/{name}/history 表1 路径参数
是否可以直接连接CCE集群的控制节点? CCE支持使用Kubectl工具连接集群,具体请参见通过Kubectl连接集群。 CCE不支持登录控制节点执行相关操作。 父主题: 集群运行
kubectl是Kubernetes集群的命令行工具,您可以将kubectl安装在任意一台机器上,通过kubectl命令操作Kubernetes集群。 CCE集群的kubectl安装请参见通过kubectl连接集群。连接后您可以执行kubectl cluster-info查看集群的信息,如下所示。 #
参数和类型都彼此相同,您无法在节点池中配置单个节点,任何配置更改都会影响节点池中的所有节点。 CCE提供的节点池相关功能包括:创建节点池、查看节点池、编辑节点池、删除节点池、拷贝节点池、迁移节点。 创建节点池 管理节点池 工作负载管理 CCE Standard集群、CCE Turbo集群、CCE
通过特权容器功能优化内核参数 前提条件 从客户端机器访问Kubernetes集群,需要使用Kubernetes命令行工具kubectl,请先连接kubectl。详情请参见通过kubectl连接集群。 操作步骤 通过后台创建daemonSet,选择nginx镜像、开启特权容器、配置生命周期、添加hostNetwork:
查询指定节点池支持配置的参数内容 功能介绍 该API用于查询指定节点池支持配置的参数内容。 调用方法 请参见如何调用API。 URI GET /api/v3/projects/{project_id}/clusters/{cluster_id}/nodepools/{nodepo
查询指定集群支持配置的参数列表 功能介绍 该API用于查询CCE服务下指定集群支持配置的参数列表。 调用方法 请参见如何调用API。 URI GET /api/v3/projects/{project_id}/clusters/{cluster_id}/configuration/detail
| awk '{print $1, $2}' 该命令查找了192.168.0.106节点上所有的Pod,并且查找了annotation中存在nvidia0(代表第0张卡)信息的Pod。最终输出了Pod所在的命名空间和Pod名称。查询结果如下: 代表default命名空间下名为k8-job-rhblr的Pod使用了192
在“Pod”页签界面,单击“开始诊断”,选择要进行诊断的Pod,单击“确定”开启诊断。 图1 开始诊断 诊断完成后,单击“查看详情”,查看诊断结果。 图2 诊断结束 图3 诊断结果查看 父主题: 健康中心
查询指定节点池支持配置的参数列表 功能介绍 该API用于查询CCE服务下指定节点池支持配置的参数列表。 调用方法 请参见如何调用API。 URI GET /api/v3/projects/{project_id}/clusters/{cluster_id}/nodepools/{
流量权重,并一直暂停,直到用户取消或继续发布。可通过以下命令查看详细过程,该发布正处于暂停状态。 kubectl argo rollouts get rollout rollout-canary --watch 可查看5个副本中有1个运行新版本,其余4个仍然运行旧版本,即setWeight:
[镜像仓库地址]/[组织名称]/[镜像名称2:版本名称2] [镜像名称1:版本名称1]:请替换为您本地所要上传的实际镜像的名称和版本名称。 [镜像仓库地址]:可在SWR控制台上查询,登录指令中末尾的域名即为镜像仓库地址。 [组织名称]:请替换为已创建的组织名称。 [镜像名称2:版本名称2]:请替换为SWR镜像仓库中需要显示的镜像名称和镜像版本。
OBS存储数据预置 创建OBS桶,并确认以下文件夹已创建,文件已上传至指定位置(需要使用OBS Browser工具)。 例如:桶内文件路径/文件名,文件下载地址可至github中指定项目的指定路径下查找,示例如1、2所示。 models/bvlc_reference_caffenet/bvlc_reference_caffenet
OnFailure 提交作业,开始训练。 kubectl apply -f mnist.yaml 等待训练作业完成,通过Kubeflow的UI可以查询训练结果信息。至此就完成了一次简单的分布式训练任务。Kubeflow的借助TFJob简化了作业的配置。Volcano通过简单的增加一行配置