AI开发平台MODELARTS-创建训练作业时出现“实例挂卷失败”的事件:处理步骤
时间:2024-11-22 17:40:43
处理步骤
- 进入训练作业详情页,在左侧获取SFS Turbo的名称。
图1 获取SFS Turbo的名称
- 登录弹性文件服务SFS控制台,在SFS Turbo列表找到训练作业挂载的SFS Turbo,单击名称进入详情页。获取VPC信息、安全组信息和endpoint信息。
- VPC信息:SFS Turbo详情页的“虚拟私有云”。
- 安全组信息:SFS Turbo详情页的“安全组”。
- endpoint信息:SFS Turbo详情页的“共享路径”,去除“:/”即为sfs-turbo-endpoint。例如共享路径为“4ab556b5-d689-44f1-9302-24c09daxxxxc.sfsturbo.internal:/”,则sfs-turbo-endpoint为“4ab556b5-d689-44f1-9302-24c09daxxxxc.sfsturbo.internal”。
- 查看SFS Turbo的VPC网段是否满足如下2个条件。
条件一:SFS Turbo网段不能与192.168.20.0/24重叠,否则会和专属资源池的网段发生冲突,因为专属资源池的默认网段为192.168.20.0/24。专属资源池实际使用的网段可以在资源池的详情页面查看“网络”获取。
条件二:SFS Turbo网段不能与172网段重叠,否则会和容器网络发生冲突,因为容器网络使用的是172网段。
- 如果不满足条件,则修改SFS Turbo的VPC网段,推荐网段为10.X.X.X。具体操作请参见修改虚拟私有云网段。
- 如果满足条件,则继续下一步。
- 查看SFS Turbo的VPC网段的安全组是否被限制了。
在所选专属资源池中新建一个未挂载的SFS Turbo的训练作业,当训练作业处于“运行中”时,通过Cloud Shell功能登录训练作业worker-0实例,使用curl {sfs-turbo-endpoint}:{port}命令检查port是否正常打开,SFS Turbo所需要入方向的端口号为111、445、2049、2051、2052、20048,具体请参见创建文件系统的“安全组”参数。Cloud Shell功能的操作指导请参见使用CloudShell登录训练容器。
- 是,则修改安全组的配置,具体操作请参见修改安全组规则。
- 否,则继续下一步。
- 确认SFS Turbo是否存在异常。
新建一个和SFS Turbo在同一个网段的E CS ,用ECS去挂载SFS Turbo,如果挂载失败,则表示SFS Turbo异常。
- 是,联系SFS服务的技术支持处理。
- 否,联系ModelArts的技术支持处理。
support.huaweicloud.com/trouble-modelarts/modelarts_trouble_0119.html
看了此文的人还看了
CDN加速
GaussDB
文字转换成语音
免费的服务器
如何创建网站
域名网站购买
私有云桌面
云主机哪个好
域名怎么备案
手机云电脑
SSL证书申请
云点播服务器
免费OCR是什么
电脑云桌面
域名备案怎么弄
语音转文字
文字图片识别
云桌面是什么
网址安全检测
网站建设搭建
国外CDN加速
SSL免费证书申请
短信批量发送
图片OCR识别
云数据库MySQL
个人域名购买
录音转文字
扫描图片识别文字
OCR图片识别
行驶证识别
虚拟电话号码
电话呼叫中心软件
怎么制作一个网站
Email注册网站
华为VNC
图像文字识别
企业网站制作
个人网站搭建
华为云计算
免费租用云托管
云桌面云服务器
ocr文字识别免费版
HTTPS证书申请
图片文字识别转换
国外域名注册商
使用免费虚拟主机
云电脑主机多少钱
鲲鹏云手机
短信验证码平台
OCR图片文字识别
SSL证书是什么
申请企业邮箱步骤
免费的企业用邮箱
云免流搭建教程
域名价格
推荐文章
- ModelArts计费说明_计费简介_ModelArts怎么计费
- ModelArts模型训练_创建训练作业_如何创建训练作业
- ModelArts开发环境_开发环境简介_开发环境怎么使用
- ModelArts自定义镜像_自定义镜像简介_如何使用自定义镜像
- RDS for MySQL数据库实例是什么_创建mysql实例步骤_如何创建RDS for MySQL数据库实例
- ModelArts推理部署_AI应用_部署服务-华为云
- 处理主机告警事件_主机安全告警_怎么处理主机安全告警
- ModelArts模型训练_模型训练简介_如何训练模型
- ModelArts分布式训练_分布式训练介绍_分布式调测
- ModelArts模型训练_超参搜索简介_超参搜索算法