检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ckpoint)保存和加载。训练数据的读取要尽量读得快,减少计算对 I/O 的等待,而 Checkpoint主要要求高吞吐、减少训练中断的时间。 文件接口方式的数据共享访问:由于 AI 架构需要使用到大规模的计算集群(GPU/NPU服务器),集群中的服务器访问的数据来自一个统一的
Windows IIS服务器挂载NFS文件系统失败 现象描述 将NFS文件系统挂载到Windows IIS服务器时,报错路径格式不支持,挂载失败。 可能原因 IIS Web服务器的物理路径错误。 定位思路 根据可能原因进行故障排查。 解决方法 登录云服务器。以下以Windows Server
client_connections 客户端连接数 该指标用于统计测量客户端连接数。 说明: 连接数统计的是活跃的客户端链接。 如果客户端长时间无 IO,网络链接会自动断开,当有 IO 时客户端会自动重新建立网络链接。 ≥ 0 弹性文件服务Turbo 1分钟 data_read_io_bytes
与模型大小、存储的IO性能等密切相关,往往需要几分钟到几十分钟不等,为了保证训练状态的一致性,保存checkpoint时训练必须暂停,保存时间影响了训练过程的整体效率。当发生故障,训练程序从已有checkpoint恢复时,每张卡都需要从持久化存储中加载,在训练集群规模较大,存储带
Required 用户必须首先使用代理服务器进行验证,这样请求才会被处理。 408 Request Timeout 请求超出了服务器的等待时间。 409 Conflict 由于冲突,请求无法被完成。 500 Internal Server Error 请求未完成。服务异常。 501
云服务器无法访问文件系统 现象描述 云服务器无法访问文件系统,提示被拒绝,导致该云服务器的所有业务异常。 可能原因 原因1:文件系统状态异常。 原因2:云服务器在强制umount之后,无法挂载。 定位思路 根据可能原因进行故障排查。 解决方法 原因1:文件系统状态异常。 登录管理
指明与服务器的连接是长连接还是短连接。 类型:字符串。 有效值:keep-alive | close。 默认值:无。 Date 系统响应的时间。 类型:字符串。 默认值:无。 x-obs-id-2 帮助定位问题的特殊符号。 类型:字符串。 默认值:无。 x-obs-request-id
Required 用户必须首先使用代理服务器进行验证,这样请求才会被处理。 408 Request Timeout 请求超出了服务器的等待时间。 409 Conflict 由于冲突,请求无法被完成。 500 Internal Server Error 请求未完成。服务异常。 501
开始按新规格的价格计费,旧订单自动失效。 如果您在一个小时内变更了资源规格,将会产生多条计费信息。每条计费信息的开始时间和结束时间对应不同规格在该小时内的生效时间。 例如,您在9:00:00购买了一个按需计费的SFS Turbo 40MB/s/TiB文件系统,存储容量是500GB
Required 用户必须首先使用代理服务器进行验证,这样请求才会被处理。 408 Request Timeout 请求超出了服务器的等待时间。 409 Conflict 由于冲突,请求无法被完成。 500 Internal Server Error 请求未完成。服务异常。 501
SFS:获取所有文件系统列表。 枚举值: SFS Authorization 是 String 签名信息 Date 是 String 请求时间 Host 是 String 表明主机地址。如sfs3.cn-north-4.myhuaweicloud.com。 响应参数 状态码: 200
Required 用户必须首先使用代理服务器进行验证,这样请求才会被处理。 408 Request Timeout 请求超出了服务器的等待时间。 409 Conflict 由于冲突,请求无法被完成。 500 Internal Server Error 请求未完成。服务异常。 501
如何从云服务器访问文件系统? 要访问您的文件系统,如果是Linux云服务器,您需要在Linux云服务器上安装NFS客户端后使用挂载命令挂载文件系统;如果是Windows云服务器,您需要在Windows云服务器上安装NFS客户端,修改NFS传输协议后使用挂载命令挂载文件系统。或使用
String 共享描述。 host String 共享主机名。 name String 共享名称。 created_at String 共享创建的时间标签。 share_proto String 文件系统的共享协议。 share_type_name String 共享类型的名称,共享类型
String 共享描述。 host String 共享主机名。 name String 共享名称。 created_at String 共享创建的时间标签。 share_proto String 文件系统的共享协议。 share_type_name String 共享类型的名称,共享类型
挂载NFS文件系统子目录到云服务器(Linux) 本章节介绍如何将NFS文件系统的子目录挂载至Linux云服务器上。 前提条件 已参考挂载NFS文件系统到云服务器(Linux)成功将文件系统挂载至Linux云服务器上。 操作步骤 执行如下命令,在本地路径下创建文件系统的子目录。 mkdir
挂载至两种服务器系统的文件系统无法写入数据 现象描述 当将同一个文件系统分别挂载到已创建的Linux云服务器和Windows云服务器后,在Windows云服务器上无法对在Linux云服务器上创建的文件写入数据。 可能原因 由于共享的NFS文件系统归属于root权限,且无法修改该所
统。 卸载加密文件系统 如果加密文件系统使用的自定义密钥被执行禁用或计划删除操作,当操作生效后,使用该自定义密钥加密的文件系统仅可以在一段时间内(默认为30s)正常使用。请谨慎操作。 卸载文件系统的具体操作请参见卸载文件系统。
挂载NFS协议类型文件系统到云服务器(Windows) 当创建文件系统后,您需要使用云服务器来挂载该文件系统,以实现多个云服务器共享使用文件系统的目的。 本章节以Windows 2012版本操作系统为例进行NFS文件系统挂载,其他版本请参考以下主要步骤根据实际界面进行配置。 同一
dest_prefix String 和src_prefix保持一致 start_time String 任务开始时间 end_time String 任务结束时间 message String 任务执行结果信息 状态码: 400 表5 响应Header参数 参数 参数类型 描述