检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查询所有v1版本的API 功能介绍 get available resources 调用方法 请参见如何调用API。 URI GET /api/v1 请求参数 表1 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。
查询所有crd.yangtse.cni/v1的API 功能介绍 查询所有crd.yangtse.cni/v1的API 调用方法 请参见如何调用API。 URI GET /apis/crd.yangtse.cni/v1 请求参数 表1 请求Header参数 参数 是否必选 参数类型
查询所有batch.volcano.sh/v1alpha1的API 功能介绍 查询所有batch.volcano.sh/v1alpha1的API 调用方法 请参见如何调用API。 URI GET /apis/batch.volcano.sh/v1alpha1 请求参数 表1 请求Header参数
查询指定namespace下的PersistentVolumeClaims 功能介绍 查询Namespace下的所有PersistentVolumeClaim。 调用方法 请参见如何调用API。 URI GET /api/v1/namespaces/{namespace}/persistentvolumeclaims
查询所有networking.cci.io/v1beta1的API 功能介绍 get available resources 调用方法 请参见如何调用API。 URI GET /apis/networking.cci.io/v1beta1 请求参数 表1 请求Header参数 参数
定位思路 当工作负载状态异常时,建议先查看事件。 在CCI控制台中,单击左侧导航栏的“工作负载”,单击异常工作负载名称,进入详情页面,在Pod列表中,单击异常实例左边的,显示该实例的详情,单击事件页签。 图1 查看事件 父主题: 工作负载异常
查询/apis/storage.k8s.io/v1版本的所有storage class 功能介绍 list or watch objects of kind StorageClass 调用方法 请参见如何调用API。 URI GET /apis/storage.k8s.io/v1/storageclasses
查询所有metrics.k8s.io/v1beta1的API 功能介绍 get available resources 调用方法 请参见如何调用API。 URI GET /apis/metrics.k8s.io/v1beta1 请求参数 表1 请求Header参数 参数 是否必选
查询指定namespace下的所有PyTorchJob 功能介绍 查询Namespace下所有PyTorchJob的详细信息。 URI GET /apis/kubeflow.org/v1/namespaces/{namespace}/pytorchjobs 表1 Path参数 参数
"containerPort": 2222, "name": "tfjob-port" }
管理镜像快照 查看镜像快照 创建镜像快照后,您可以查询镜像快照信息。 查询用户创建的所有镜像快照,执行如下命令。 kubectl get imagesnapshot -oyaml 查询单个镜像快照,执行如下命令。 kubectl get imagesnapshot my-imagesnapshot
小时(状态变为SchedulingDisabled),期间无法调度至CCI。 解决方案:用户可通过CCE集群控制台,使用kubectl工具查看bursting节点状态,如果节点被锁定,可手动解锁bursting节点。 问题二:弹性CCI功能不可用 问题原因:用户CCE集群所在子网与10
2G,请您提前做好转储。 图2 使用日志存储 查看日志 负载创建完成后,您可以查看容器日志。 单击已创建的负载,在容器实例所在行,单击“查看日志”。 图3 查看日志 在AOM界面中即可查看对应容器的日志,AOM中日志查询方法请参见查看日志文件。
使用Nvidia-smi工具 为了支持查看GPU使用情况的场景,需要在镜像中注入nvidia-smi工具,根据购买的专属节点GPU驱动版本选择不同的nvidia-smi二进制文件。 nvidia-smi获取方式。 该二进制文件可以在nvidia官网,根据CUDA Toolkit版
"containerPort": 2222, "name": "tfjob-port" }
e/#type-nodeport port Integer The port that will be exposed by this service. protocol String The IP protocol for this port. Supports "TCP", "UDP"
"containerPort": 2222, "name": "tfjob-port" }
服务资源的权限,单击“同意授权”。 授信成功后,将会创建一个委托,委托名称为“cci_admin_trust”,您可以在IAM服务控制台中查看。 (可选)上传镜像 云平台提供了容器镜像服务,您可以上传容器镜像到容器镜像仓库中,创建负载时使用该镜像,具体使用方法请参见客户端上传镜像。
defined. port 是 Integer The port number of the endpoint. protocol 否 String The IP protocol for this port. Must be UDP, TCP, or SCTP. Default is TCP
监控安全风险 通过AOM查看Pod监控数据 为使用户更好的掌握工作负载的运行状态,CCI配合AOM对其进行全方位的监控。 通过AOM界面您可监控CCI的基础资源和运行在CCI上的应用,同时在AOM界面还可查看相关的日志和告警。 更多内容,请参见监控管理。 Pod资源监控指标 CC