搜索_华为云

训练 - 弹性文件服务 SFS
训练 - 弹性文件服务 SFS

训练上传数据至OBS并预热到SFS Turbo中创建训练任务父主题：实施步骤

 帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤
创建训练任务 - 弹性文件服务 SFS

创建训练任务基于SFS Turbo共享文件存储创建ModelArts训练任务。登录ModelArts管理控制台。在左侧导航栏中选择“训练管理 > 训练作业”，进入“训练作业”列表。单击右上角的“创建训练作业”，进入“创建训练作业”页面，在该页面填写训练作业相关参数信息。

帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤 > 训练
通过AITurbo加速保存与加载checkpoint - 弹性文件服务 SFS

oint 背景当前，大模型训练往往使用成百上千加速卡训练几周到几个月不等。在训练过程中，故障导致训练中断经常发生。训练程序一般采用周期checkpoint方案来将训练状态持久化到存储，当发生故障时，训练程序能恢复到故障之前的模型和优化器的状态继续训练。原生Pytorch系框架在

 帮助中心 > 弹性文件服务 SFS > 用户指南 > SFS Turbo文件系统
上传数据至OBS并预热到SFS Turbo中 - 弹性文件服务 SFS

将数据从OBS预热到SFS Turbo中 SFS Turbo HPC型文件系统绑定OBS桶后，可以使用数据预热功能，以减少后续训练首次访问数据耗时。训练任务开始前可通过数据预热功能将文件元数据和数据内容全部从OBS导入到SFS Turbo高性能文件存储中，数据预热功能的具体操作请参考创建SFS

帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤 > 训练
常见问题 - 弹性文件服务 SFS
常见问题 - 弹性文件服务 SFS

可以只使用SFS Turbo HPC型文件系统支撑AI训练吗？当数据规模较小，不存在冷热数据分级降本诉求，又希望能方便快捷的构建AI训练系统时，可以选择只使用SFS Turbo高性能文件存储支撑AI训练。可以基于OBS对象存储支撑AI自动驾驶、大模型训练吗？ OBS为容量型存储，在时延、带宽

 帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
方案概述 - 弹性文件服务 SFS
方案概述 - 弹性文件服务 SFS

Turbo高性能，加速训练过程训练数据集高速读取，避免GPU/NPU因存储I/O等待产生空闲，提升GPU/NPU利用率。大模型TB级Checkpoint文件秒级保存和加载，减少训练任务中断时间。 3 数据导入导出异步化，不占用训练任务时长，无需部署外部迁移工具训练任务开始前将数据从OBS导入到SFS

帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
配置SFS Turbo数据自动导出到OBS桶 - 弹性文件服务 SFS

配置SFS Turbo数据自动导出到OBS桶配置自动导出后，训练过程中周期性写入SFS Turbo文件系统的Checkpoint模型文件会自动以异步方式导出到关联的OBS桶中进行长期保存，无需手工导出，异步导出方式不会占用上层训练任务时间。 SFS Turbo的自动导出功能当前处于受限

 帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤 > 基本配置
管理SFS Turbo文件系统与OBS桶的存储联动 - 弹性文件服务 SFS

管理SFS Turbo文件系统与OBS桶的存储联动概述 AI训练和推理、高性能数据预处理、EDA、渲染、仿真等场景下，您可以通过SFS Turbo文件系统来加速OBS对象存储中的数据访问。SFS Turbo文件系统支持无缝访问存储在OBS对象存储桶中的对象。您可以指定SFS T

帮助中心 > 弹性文件服务 SFS > 用户指南 > SFS Turbo文件系统
同时挂载至两个服务器的文件系统数据存在延时怎么办？ - 弹性文件服务 SFS

同时挂载至两个服务器的文件系统数据存在延时怎么办？现象描述当服务器A和服务器B同时挂载同一文件系统C时，在服务器A上传文件，服务器B同步此文件时存在延时，而单独上传至服务器B则没有延时。定位思路需要在两个服务器的挂载参数中增加参数noac和lookupcache=none。

帮助中心 > 弹性文件服务 SFS > 常见问题 > 网络类
资源和成本规划 - 弹性文件服务 SFS

资源和成本规划本节介绍最佳实践中资源规划情况，包含以下内容：表1 资源和成本规划内容说明维度说明资源规划 OBS：存放训练数据集、预训练模型等数据资源的桶，桶存储类别为“标准存储”，桶策略为“私有”。 SFS Turbo：文件系统类型为“HPC型”，存储类型请根据存储容

 帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
应用场景 - 弹性文件服务 SFS
应用场景 - 弹性文件服务 SFS

日志存储、文件共享、内容管理、网站日志存储、文件共享、内容管理、网站 AI训练、自动驾驶、EDA仿真、渲染、企业NAS应用、高性能web应用 AI训练、自动驾驶、EDA仿真、渲染、企业NAS应用、高性能web应用大规模AI训练、AI大模型、AIGC 大规模AI训练、AI大模型、AIGC 表3 SFS Turbo上一代文件系统

 帮助中心 > 弹性文件服务 SFS > 产品介绍
文件系统类型 - 弹性文件服务 SFS

日志存储、文件共享、内容管理、网站日志存储、文件共享、内容管理、网站 AI训练、自动驾驶、EDA仿真、渲染、企业NAS应用、高性能web应用 AI训练、自动驾驶、EDA仿真、渲染、企业NAS应用、高性能web应用大规模AI训练、AI大模型、AIGC 大规模AI训练、AI大模型、AIGC 表4 SFS Turbo上一代文件系统

 帮助中心 > 弹性文件服务 SFS > 产品介绍
实施步骤 - 弹性文件服务 SFS
实施步骤 - 弹性文件服务 SFS

实施步骤创建资源基本配置训练例行维护父主题：面向AI场景使用OBS+SFS Turbo的存储加速实践

 帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
操作流程 - 弹性文件服务 SFS
操作流程 - 弹性文件服务 SFS

Turbo和OBS联动。配置SFS Turbo数据自动导出到OBS桶。配置SFS Turbo数据淘汰策略。 4 训练上传数据至OBS并预热到SFS Turbo中。创建训练任务。 5 例行运维使用OBS+SFS Turbo的存储加速方案的过程中，您可以进行采取以下运维措施，保证系统正常高效运行：

帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
弹性文件服务-功能总览 - 弹性文件服务 SFS

Turbo性能型-增强版：图片渲染、AI训练、企业办公OA 125MB/s/TiB：高性能计算、AI训练、EDA仿真、自动驾驶、渲染 250MB/s/TiB：高性能计算、AI训练、EDA仿真、自动驾驶、渲染 HPC缓存型：影视渲染、AI训练、自动驾驶支持区域：全部文件系统类型

 帮助中心 > 弹性文件服务 SFS > 功能总览
例行维护 - 弹性文件服务 SFS
例行维护 - 弹性文件服务 SFS

Turbo文件系统的性能使用情况。当AI算力集群规模变大，大模型参数量变大，导致Checkpoint读加载时间变长时，或训练数据集加载由于存储读写带宽不足导致拖慢AI训练时，您可以对SFS Turbo进行性能扩容，以缩短数据加载时长。详情可参见SFS Turbo监控指标说明和创建告警规则。

帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤
创建资源 - 弹性文件服务 SFS
创建资源 - 弹性文件服务 SFS

操作指导请参考创建OBS桶。创建ModelArts资源池以常见的专属资源池为例，专属资源池提供独享的计算资源，可用于Notebook、训练作业、部署模型。专属资源池不与其他用户共享，更加高效。在使用专属资源池之前，您需要先创建一个专属资源池，操作指导请参考创建专属资源池。父主题：

帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤
配置ModelArts和SFS Turbo间网络直通 - 弹性文件服务 SFS

配置ModelArts网络关联SFS Turbo ModelArts网络关联SFS Turbo后，可直接在ModelArts的Notebook开发及训练环境中挂载SFS Turbo共享文件系统，并访问其中的数据。登录ModelArts管理控制台，创建网络并打通创建资源中创建的创建虚拟私有

 帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤 > 基本配置
网络类 - 弹性文件服务 SFS
网络类 - 弹性文件服务 SFS

是否支持跨VPC访问文件系统？弹性文件服务支持跨区域挂载吗？ VPC的安全组是否影响弹性文件服务的使用？同时挂载至两个服务器的文件系统数据存在延时怎么办？

帮助中心 > 弹性文件服务 SFS > 常见问题
生命周期管理 - 弹性文件服务 SFS

低频存储的计费相关内容请详见计费项。转换为低频存储的数据可正常访问数据转储为低频存储后，文件系统的内容和结构保持不变，应用可正常访问这些数据，不需要修改应用或暂停业务。配置生命周期规则您可以为某个文件系统或文件系统内的某个目录路径设置生命周期规则，符合生命周期规则的文件将从标准存储转换为低频存储。

帮助中心 > 弹性文件服务 SFS > 用户指南 > 通用文件系统

总条数： 23

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练 - 弹性文件服务 SFS

创建训练任务 - 弹性文件服务 SFS

通过AITurbo加速保存与加载checkpoint - 弹性文件服务 SFS

上传数据至OBS并预热到SFS Turbo中 - 弹性文件服务 SFS

常见问题 - 弹性文件服务 SFS

方案概述 - 弹性文件服务 SFS

配置SFS Turbo数据自动导出到OBS桶 - 弹性文件服务 SFS

管理SFS Turbo文件系统与OBS桶的存储联动 - 弹性文件服务 SFS

同时挂载至两个服务器的文件系统数据存在延时怎么办？ - 弹性文件服务 SFS

资源和成本规划 - 弹性文件服务 SFS

应用场景 - 弹性文件服务 SFS

文件系统类型 - 弹性文件服务 SFS

实施步骤 - 弹性文件服务 SFS

操作流程 - 弹性文件服务 SFS

弹性文件服务-功能总览 - 弹性文件服务 SFS

例行维护 - 弹性文件服务 SFS

创建资源 - 弹性文件服务 SFS

配置ModelArts和SFS Turbo间网络直通 - 弹性文件服务 SFS

网络类 - 弹性文件服务 SFS

生命周期管理 - 弹性文件服务 SFS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线