检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
_summaries.py" 创建TFJob。 kubectl apply -f tf-mnist.yaml 等待worker运行完毕后,查看运行日志。 kubectl -n kubeflow logs tfjob-simple-worker-0 回显如下: ... Accuracy
# 存储ID 这里csi下面的内容就是CCE中特定的字段,在其他地方无法使用。 下面创建这个PV并查看。 $ kubectl create -f pv.yaml persistentvolume/pv-example created $ kubectl
载场景下的容器网络性能。现象如下: 排查方法 1、快速排查方法 适用于节点为按需计费类型,若您的节点为该类型,可从cce-console上查看节点创建时间,2021年2月24日及之后创建的CentOS 7.6节点无该问题。 2、准确排查方法(通用) 您可以执行下述步骤排查节点是否受此问题影响:
corefile_record.txt 对比2和3的输出差异。 diff corefile_now.txt corefile_record.txt -y; 图1 查看输出差异 返回CCE控制台,单击集群名称进入集群控制台,前往“插件中心”,选择CoreDNS插件单击“升级”。 若要保留差异部分配置,您可采用以下方法之一:
成本标签激活后,才能在分析成本数据时通过标签进行过滤或汇总。成本标签不会应用于激活之前产生的成本中。 操作步骤 激活CCE-Cluster-ID成本标签。 登录成本中心,查找CCE-Cluster-ID,在操作一列单击“激活”,如下图所示。 图1 激活成本标签 激活成功后显示如下。 图2 激活成功 给集群所使用资源打标签。
Many指以读写方式挂载到多个节点,ReadWriteOnce指以读写方式挂载到单个节点。 配置建议: 根据存储卷类型进行配置。如块存储及本地持久卷存储配置ReadWriteOnce,文件存储及对象存储配置ReadWriteMany 父主题: 存储卷声明
脚本完成CCE组件清理,具体步骤参见重装操作系统失败如何处理。 移除节点会导致与节点关联的本地持久卷类型的PVC/PV数据丢失,无法恢复,且PVC/PV无法再正常使用。移除节点时使用了本地持久存储卷的Pod会从移除的节点上驱逐,并重新创建Pod,Pod会一直处于pending状态
NPU)版本发布记录 Volcano调度器版本发布记录 CCE密钥管理(对接 DEW)插件版本发布记录 CCE容器网络扩展指标插件版本发布记录 节点本地域名解析加速插件版本发布记录 云原生监控插件版本发布记录 云原生日志采集插件版本发布记录 容器镜像签名验证插件版本发布记录 Grafana插件版本发布记录
按需资源不会立即停止服务,资源进入宽限期。您需支付按需资源在宽限期内产生的费用,相关费用可在管理控制台 > 费用中心 >总览“欠费金额”查看,华为云将在您充值时自动扣取欠费金额。 如果您在宽限期内仍未支付欠款,那么就会进入保留期,资源状态变为“已冻结”,您将无法对处于保留期的按需计费资源执行任何操作。
number: 50051 执行以下命令创建Ingress路由规则。 kubectl apply -f grpc-ingress.yaml 结果验证 本地安装grpcurl工具后,执行以下命令,验证是否安装成功 ./grpcurl -insecure -servername "grpc.example
default-secret的data数据会定期更新,且当前的data内容会在一定时间后会过期失效。您可以使用describe命令在default-secret的中查看到具体的过期时间,如下所示。 在使用时请直接使用default-secret,而不要复制secret内容重新创建,因为secret里面的凭据会过期,从而导致无法拉取镜像。
labels 无 无 允许 - 标签是资源对象的一种附加标识,可以通过标签进行过滤查询 配置建议: 用户按需将一些查询和管理维度(如密钥所属业务领域、微服务等)抽象为标签,方便对配置项进行过滤查询 父主题: 密钥
targetPort: 80 port: 8080 protocol: TCP type: ClusterIP 查看Service,发现Endpoints一行的值为空,表示没有Endpoints。 $ kubectl describe svc nginx
如果您出现以上集群过载的情况,您也可以提交工单以获取技术支持。 排查项三:集群Secret落盘加密使用的KMS密钥是否有效 问题现象 当出现集群不可用,您可以查看集群事件确认异常原因。 当集群事件中存在“KMS密钥状态异常”时,您需要确认该集群对应的使用的密钥状态是否被设置为“禁用”或“计划删除”。
Toolkit的基础镜像构建应用容器镜像。GPU驱动和CUDA Toolkit版本需要配套才可以正常使用GPU资源。 您可以使用nvidia-smi命令查看的节点上驱动信息,确定Nvidia驱动与CUDA Toolkit版本的配套关系,如下图,驱动版本为470.141.03, 对应支持的CUDA
可以使用kubectl get命令查询具体Pod的配置信息,如下所示,-o yaml表示以YAML格式返回,还可以使用-o json,以JSON格式返回。 $ kubectl get pod nginx -o yaml 您还可以使用kubectl describe命令查看Pod的详情。 $ kubectl
集群删除失败:安全组中存在残留资源 CCE在删除集群时,会连接集群的kube-apiserver查询集群对接的周边资源信息,如Turbo集群对接的弹性网卡/弹性辅助网卡等,当CCE集群的状态为不可用,冻结,休眠等状态时,删除集群有可能会出现查询资源失败而导致集群删除失败的情况。 故障现象 删除集群失败,报错信息如下:
如何调用API。 终端节点(Endpoint) 终端节点(Endpoint)即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点查询服务的终端节点。 请您根据业务需要选择对应区域的终端节点。 集群管理、节点管理、节点池管理、配额管理的URL格式为:https://End
表示作业是否可抢占。开启后,认为该作业可以被抢占。 取值范围: true:开启抢占。(默认为开启状态) false:关闭抢占。 可通过查询Pod详情查看Pod是否由Volcano调度,以及被分配的队列: kubectl describe pod <pod_name> 回显如下: Spec:
ngress使用IPv6/IPv4双栈协议,将产生相关告警事件(不支持在ELB添加IPv6地址后端),您可前往对应Ingress的“事件”查看相关告警。 仅支持IPv4协议。 Nginx型Ingress 满足以下条件时支持使用双栈: v1.19至v1.23集群:安装2.1.7版本