检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
路径:后端应用对外提供访问的路径,此处添加的访问路径要求后端应用内存在相同的路径,否则转发无法生效。 目标服务名称:请选择已有Service或新建Service。页面列表中的查询结果已自动过滤不符合要求的Service。 目标服务访问端口:可选择目标Service的访问端口。 域名:无需填写 路径匹配规则:前缀匹配
OnFailure 提交作业,开始训练。 kubectl apply -f mnist.yaml 等待训练作业完成,通过Kubeflow的UI可以查询训练结果信息。至此就完成了一次简单的分布式训练任务。Kubeflow的借助TFJob简化了作业的配置。Volcano通过简单的增加一行配置
路径:后端应用对外提供访问的路径,此处添加的访问路径要求后端应用内存在相同的路径,否则转发无法生效。 目标服务名称:请选择已有Service或新建Service。页面列表中的查询结果已自动过滤不符合要求的Service。 目标服务访问端口:可选择目标Service的访问端口。 执行动作 动作:选择“重写URL”,当
集群/节点从下发创建命令到正常运行存在时间差,计费的起点是集群/节点创建成功的时间点,而非开始创建时间。您可以在CCE控制台中的“操作记录”中查看这两个时间。 例如,您在8:45:30购买了一个按需计费的集群,然后在8:55:30将其删除,则计费周期为8:00:00 ~ 9:00:00,在8:45:30
type: LoadBalancer 验证四层会话保持是否开启。 登录ELB控制台找到对应的ELB,并在ELB所在行中单击的对应监听器名称。 查看后端服务器组中,会话保持配置是否开启。 图1 开启四层会话保持 在CCE Turbo集群中开启四层会话保持 在CCE Turbo集群中,S
前往ECS控制台为节点添加SCSI类型的磁盘。操作步骤详情请参见新增磁盘。 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“存储”,并切换至“存储池”页签。 查看已添加磁盘的节点,选择“导入临时卷”,导入时可以选择写入模式。 如存储池列表中未找到手动挂载的磁盘,请耐心等待1分钟后刷新列表。 线性:线
填写“实例名称”,选择“命名空间”和“选择版本”。 单击“配置文件”后的“添加文件”按钮,选择本地创建的YAML配置文件,单击“安装”。 在“模板实例”页签下可以查看模板实例的安装情况。 测试验证 创建一个工作负载,配置新部署的Nginx Ingress Controller为其提供网络访问。 创建nginx工作负载。
按需资源不会立即停止服务,资源进入宽限期。您需支付按需资源在宽限期内产生的费用,相关费用可在管理控制台 > 费用中心 >总览“欠费金额”查看,华为云将在您充值时自动扣取欠费金额。 如果您在宽限期内仍未支付欠款,那么就会进入保留期,资源状态变为“已冻结”,您将无法对处于保留期的按需计费资源执行任何操作。
Xshell、SecureCRT等)登录弹性云服务器。如果普通远程连接软件无法使用,您可以使用云服务器ECS管理控制台的管理终端连接实例,查看云服务器操作界面当时的状态。 SSH方式登录包括SSH密钥和SSH密码两种方式。详细操作请参考SSH密钥方式登录、SSH密码方式登录。 本
"mysql" created 查看工作负载状态。 kubectl get statefulset 回显如下,表示工作负载已创建成功。 NAME READY AGE mysql 1/1 4m5s 查看服务。 kubectl get
前往ECS控制台为节点添加SCSI类型的磁盘。操作步骤详情请参见新增磁盘。 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“存储”,并切换至“存储池”页签。 查看已添加磁盘的节点,选择“导入持久卷”,导入时可以选择写入模式。 如存储池列表中未找到手动挂载的磁盘,请耐心等待1分钟后刷新列表。 线性:线
系统中最大的连接跟踪表项数目。 可通过以下命令查询: sysctl net.nf_conntrack_max 默认:131072 - TCP连接在关闭状态下等待的时间 conntrack-tcp-timeout-close-wait 控制TCP连接在关闭状态下等待的时间。 可通过以下命令查询: sysctl net
Controller的节点亲和性配置 N/A 查看NPD事件 NPD上报的事件可以在节点管理页面查询。 登录CCE控制台。 单击集群名称进入集群,在左侧选择“节点管理”。 在节点所在行,单击“事件”,可查看节点相关事件。 图1 查看节点事件 配置NPD指标告警 针对NPD状态类检
default-secret的data数据会定期更新,且当前的data内容会在一定时间后会过期失效。您可以使用describe命令在default-secret的中查看到具体的过期时间,如下所示。 在使用时请直接使用default-secret,而不要复制secret内容重新创建,因为secret里面的凭据会过期,从而导致无法拉取镜像。
如果您出现以上集群过载的情况,您也可以提交工单以获取技术支持。 排查项三:集群Secret落盘加密使用的KMS密钥是否有效 问题现象 当出现集群不可用,您可以查看集群事件确认异常原因。 当集群事件中存在“KMS密钥状态异常”时,您需要确认该集群对应的使用的密钥状态是否被设置为“禁用”或“计划删除”。
Toolkit的基础镜像构建应用容器镜像。GPU驱动和CUDA Toolkit版本需要配套才可以正常使用GPU资源。 您可以使用nvidia-smi命令查看的节点上驱动信息,确定Nvidia驱动与CUDA Toolkit版本的配套关系,如下图,驱动版本为470.141.03, 对应支持的CUDA
targetPort: 80 port: 8080 protocol: TCP type: ClusterIP 查看Service,发现Endpoints一行的值为空,表示没有Endpoints。 $ kubectl describe svc nginx
”,单击“创建密钥对”。 输入密钥对名称,勾选“我同意将密钥对私钥托管”和“我已经阅读并同意《密钥对管理服务免责声明》”,单击“确定”。 查看并保存私钥。为保证安全,私钥只能下载一次,请妥善保管,否则将无法登录节点。 创建集群和节点。 登录CCE控制台。在“集群管理”页面单击“购买集群”,选择需要创建的集群类型。
工作负载创建。 在创建成功页面单击“返回工作负载列表”,查看工作负载状态,若显示为“运行中”则jenkins应用已可以正常访问。 登录并初始化Jenkins 在CCE控制台,单击左侧栏目树中的“服务”,在“服务”页签下查看jenkins的访问方式。 图6 访问8080端口对应的访问方式
ngress使用IPv6/IPv4双栈协议,将产生相关告警事件(不支持在ELB添加IPv6地址后端),您可前往对应Ingress的“事件”查看相关告警。 仅支持IPv4协议。 Nginx型Ingress 满足以下条件时支持使用双栈: v1.19至v1.23集群:安装2.1.7版本