检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
当发生故障时,训练程序能恢复到故障之前的模型和优化器的状态继续训练。原生Pytorch系框架在保存checkpoint时均直接持久化到存储系统,耗时与模型大小、存储的IO性能等密切相关,往往需要几分钟到几十分钟不等,为了保证训练状态的一致性,保存checkpoint时训练必须暂停
655ef9c7160ba" 的所有文件系统的标签 GET HTTPS://{endpoint}/v1/e1e45b08f3ea4480ab4655ef9c7160ba/sfs-turbo/tags 响应示例 状态码: 200 查询文件系统返回body { "tags" : [
应区域购买SFS Turbo其他规格文件系统:20MB/s/TiB、40MB/s/TiB、125MB/s/TiB、250MB/s/TiB、500MB/s/TiB、1000MB/s/TiB,具有更优惠的价格和更高的性能,详细介绍请参见文件系统类型。 已购买SFS Turbo停售规格
物理独享:存储池物理隔离,资源独享。 备份恢复 专属文件存储服务支持CBR备份,基于备份可以恢复文件存储系统。 监控文件系统 对接云监控,支持带宽、IOPS、容量等多种监控指标。 审计文件系统 支持通过云审计服务对资源的操作进行记录,以便用户可以查询、审计和回溯。 性能规格 表1 性能规格
SFS Turbo扩容类问题 SFS Turbo文件系统使用空间不足,可以扩容吗?
SFS Turbo性能类问题 如何发挥SFS Turbo文件系统的最大性能?
数据加密 创建与卸载SFS Turbo加密文件系统 通过加密传输保护网络传输链路的数据安全
共享标签 创建共享标签 查询共享标签 删除共享标签 批量添加共享标签 查询租户所有共享的标签 通过标签查询文件系统列表 父主题: API
SFS Turbo删除类问题 如何删除.nfs类型的文件? 如何提高SFS Turbo文件系统复制和删除操作的效率?
Turbo(rclone工具) 通过跨服务器迁移数据至SFS Turbo(rclone工具) 通过云专线迁移数据至SFS Turbo(rsync工具) 文件系统之间迁移数据
String MIME类型 响应参数 无 请求示例 ID为"77ba6f4b-6365-4895-8dda-bc7142af4dde"的文件系统,删除key为test的标签 DELETE HTTPS://{endpoint}/v1/{project_id}/sfs-turbo/77
础设施也带来全新的挑战。 高吞吐的数据访问挑战:随着企业使用 GPU/NPU 越来越多,底层存储的 IO 已经跟不上计算能力,企业希望存储系统能提供高吞吐的数据访问能力,充分发挥 GPU/NPU 的计算性能,包括训练数据的读取,以及为了容错做的检查点(以下简称Checkpoint
“/”。只能包含大写字母、小写字母、数字,特殊字符"-"和"_"。 请求示例 ID为"77ba6f4b-6365-4895-8dda-bc7142af4dde"的文件系统,查询标签 GET HTTPS://{endpoint}/v1/v1/{project_id}/sfs-turbo/77ba6f4b-63
用户权限时该字段必选。如果有op_service权限时,tags和sys_tags二选一。 sys_tags 否 Array of ResourceTag objects 系统标签列表。 op_service权限可以访问,和tags二选一。目前TMS调用时只包含一个resource_tag结构体,key固定为:_
火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 图1阐明了区域和可用区之间的关系。 图1 区域和可用区 目前,华为云已在全球多个地域开放云服务,您可以根据需求选择适合自己的区域