搜索_华为云

创建训练任务 - 弹性文件服务 SFS

创建训练任务基于SFS Turbo共享文件存储创建ModelArts训练任务。登录ModelArts管理控制台。在左侧导航栏中选择“训练管理 > 训练作业”，进入“训练作业”列表。单击右上角的“创建训练作业”，进入“创建训练作业”页面，在该页面填写训练作业相关参数信息。

帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤 > 训练
训练 - 弹性文件服务 SFS
训练 - 弹性文件服务 SFS

训练上传数据至OBS并预热到SFS Turbo中创建训练任务父主题：实施步骤

 帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤
配置ModelArts和SFS Turbo间网络直通 - 弹性文件服务 SFS

配置ModelArts网络关联SFS Turbo ModelArts网络关联SFS Turbo后，可直接在ModelArts的Notebook开发及训练环境中挂载SFS Turbo共享文件系统，并访问其中的数据。登录ModelArts管理控制台，创建网络并打通创建资源中创建的创建虚拟私有

 帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤 > 基本配置
通过AITurbo加速保存与加载checkpoint - 弹性文件服务 SFS

通过AITurbo加速保存与加载checkpoint 背景当前，大模型训练往往使用成百上千加速卡训练几周到几个月不等。在训练过程中，故障导致训练中断经常发生。训练程序一般采用周期checkpoint方案来将训练状态持久化到存储，当发生故障时，训练程序能恢复到故障之前的模型和优化

 帮助中心 > 弹性文件服务 SFS > 用户指南 > SFS Turbo文件系统
如何调整SFS容量型资源包的大小？ - 弹性文件服务 SFS

如何调整SFS容量型资源包的大小？如果资源包较小，希望可以扩容：可以叠加购买资源包，且会优先使用原购买资源包的容量。如果资源包较大，希望可以缩容：暂不支持直接缩容，可以先将原资源包退订后重新购买。也可以等待本资源包周期结束后重新购买来调整资源包的大小。父主题：计费类

 帮助中心 > 弹性文件服务 SFS > 常见问题 > 计费类
配置SFS Turbo数据自动导出到OBS桶 - 弹性文件服务 SFS

配置SFS Turbo数据自动导出到OBS桶配置自动导出后，训练过程中周期性写入SFS Turbo文件系统的Checkpoint模型文件会自动以异步方式导出到关联的OBS桶中进行长期保存，无需手工导出，异步导出方式不会占用上层训练任务时间。 SFS Turbo的自动导出功能当前处于受限

 帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤 > 基本配置
常见问题 - 弹性文件服务 SFS
常见问题 - 弹性文件服务 SFS

可以只使用SFS Turbo HPC型文件系统支撑AI训练吗？当数据规模较小，不存在冷热数据分级降本诉求，又希望能方便快捷的构建AI训练系统时，可以选择只使用SFS Turbo高性能文件存储支撑AI训练。可以基于OBS对象存储支撑AI自动驾驶、大模型训练吗？ OBS为容量型存储，在时延、带

 帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
上传数据至OBS并预热到SFS Turbo中 - 弹性文件服务 SFS

将数据从OBS预热到SFS Turbo中 SFS Turbo HPC型文件系统绑定OBS桶后，可以使用数据预热功能，以减少后续训练首次访问数据耗时。训练任务开始前可通过数据预热功能将文件元数据和数据内容全部从OBS导入到SFS Turbo高性能文件存储中，数据预热功能的具体操作请参考创建SFS

帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤 > 训练
方案概述 - 弹性文件服务 SFS
方案概述 - 弹性文件服务 SFS

应用场景近年来，AI快速发展并应用到很多领域中，AI新产品掀起一波又一波热潮，AI应用场景越来越多，有自动驾驶、大模型、AIGC、科学AI等不同行业。AI人工智能的实现需要大量的基础设施资源，包括高性能算力，高速存储和网络带宽等基础设施，即“大算力、大存力、大运力”的AI基础大设施底座，让算力发展不要偏斜。

帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
资源和成本规划 - 弹性文件服务 SFS

资源规划 OBS：存放训练数据集、预训练模型等数据资源的桶，桶存储类别为“标准存储”，桶策略为“私有”。 SFS Turbo：文件系统类型为“HPC型”，存储类型请根据存储容量和性能需求选择，AI场景建议选择250MB/s/TiB及以上的存储类型。 ModelArts：AI开发平台，采用多机多卡分布式训练。

帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
创建资源 - 弹性文件服务 SFS
创建资源 - 弹性文件服务 SFS

请参考创建OBS桶。创建ModelArts资源池以常见的专属资源池为例，专属资源池提供独享的计算资源，可用于Notebook、训练作业、部署模型。专属资源池不与其他用户共享，更加高效。在使用专属资源池之前，您需要先创建一个专属资源池，操作指导请参考创建专属资源池。父主题：实施步骤

 帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤
应用场景 - 弹性文件服务 SFS
应用场景 - 弹性文件服务 SFS

日志存储、文件共享、内容管理、网站 AI训练、自动驾驶、EDA仿真、渲染、企业NAS应用、高性能web应用 AI训练、自动驾驶、EDA仿真、渲染、企业NAS应用、高性能web应用大规模AI训练、AI大模型、AIGC 大规模AI训练、AI大模型、AIGC 表3 SFS Turbo上一代文件系统

 帮助中心 > 弹性文件服务 SFS > 产品介绍
构造请求 - 弹性文件服务 SFS
构造请求 - 弹性文件服务 SFS

进行资源操作时，可以使用这个URI地址。 URI的一般格式为（方括号内为可选项）： protocol://[filesystem.]domain[:port]/[?param] 表1 URI中的参数参数描述是否必选 protocol 请求使用的协议类型，如HTTP、HTTP

帮助中心 > 弹性文件服务 SFS > API参考 > 如何调用通用文件系统API
实施步骤 - 弹性文件服务 SFS
实施步骤 - 弹性文件服务 SFS

实施步骤创建资源基本配置训练例行维护父主题：面向AI场景使用OBS+SFS Turbo的存储加速实践

 帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
文件系统类型 - 弹性文件服务 SFS

日志存储、文件共享、内容管理、网站 AI训练、自动驾驶、EDA仿真、渲染、企业NAS应用、高性能web应用 AI训练、自动驾驶、EDA仿真、渲染、企业NAS应用、高性能web应用大规模AI训练、AI大模型、AIGC 大规模AI训练、AI大模型、AIGC 表4 SFS Turbo上一代文件系统

 帮助中心 > 弹性文件服务 SFS > 产品介绍
操作流程 - 弹性文件服务 SFS
操作流程 - 弹性文件服务 SFS

操作流程本文档介绍面向AI场景如何使用OBS+SFS Turbo的存储加速，流程如图1所示。图1 面向AI场景使用OBS+SFS Turbo的存储加速方案步骤表1 面向AI场景使用OBS+SFS Turbo的存储加速流程说明序号步骤说明 1 规划组网和资源此步骤请提交工单联系技术支持人员进行支撑配置。

帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
管理SFS Turbo文件系统与OBS桶的存储联动 - 弹性文件服务 SFS

管理SFS Turbo文件系统与OBS桶的存储联动概述 AI训练和推理、高性能数据预处理、EDA、渲染、仿真等场景下，您可以通过SFS Turbo文件系统来加速OBS对象存储中的数据访问。SFS Turbo文件系统支持无缝访问存储在OBS对象存储桶中的对象。您可以指定SFS T

帮助中心 > 弹性文件服务 SFS > 用户指南 > SFS Turbo文件系统
弹性文件服务-功能总览 - 弹性文件服务 SFS

SFS Turbo性能型-增强版：图片渲染、AI训练、企业办公OA 125MB/s/TiB：高性能计算、AI训练、EDA仿真、自动驾驶、渲染 250MB/s/TiB：高性能计算、AI训练、EDA仿真、自动驾驶、渲染 HPC缓存型：影视渲染、AI训练、自动驾驶支持区域：全部文件系统类型

 帮助中心 > 弹性文件服务 SFS > 功能总览
计费说明 - 弹性文件服务 SFS
计费说明 - 弹性文件服务 SFS

实际使用的存储容量和时长收费，以小时为单位，按每小时整点结算，不设最低消费标准。结算时，时长不足1小时的，按1小时计费。计费模型如表1所示。表1 计费模型资费项计费项计费公式存储空间计费文件系统所占用的存储空间容量和使用时长存储空间费用=每GB费率*存储容量*使用时长

 帮助中心 > 弹性文件服务 SFS > 产品介绍
例行维护 - 弹性文件服务 SFS
例行维护 - 弹性文件服务 SFS

您可以在CES云监控服务上监控和SFS Turbo文件系统的性能使用情况。当AI算力集群规模变大，大模型参数量变大，导致Checkpoint读加载时间变长时，或训练数据集加载由于存储读写带宽不足导致拖慢AI训练时，您可以对SFS Turbo进行性能扩容，以缩短数据加载时长。详情可参见SFS

帮助中心 > 弹性文件服务 SFS > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤

总条数： 129

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建训练任务 - 弹性文件服务 SFS

训练 - 弹性文件服务 SFS

配置ModelArts和SFS Turbo间网络直通 - 弹性文件服务 SFS

通过AITurbo加速保存与加载checkpoint - 弹性文件服务 SFS

如何调整SFS容量型资源包的大小？ - 弹性文件服务 SFS

配置SFS Turbo数据自动导出到OBS桶 - 弹性文件服务 SFS

常见问题 - 弹性文件服务 SFS

上传数据至OBS并预热到SFS Turbo中 - 弹性文件服务 SFS

方案概述 - 弹性文件服务 SFS

资源和成本规划 - 弹性文件服务 SFS

创建资源 - 弹性文件服务 SFS

应用场景 - 弹性文件服务 SFS

构造请求 - 弹性文件服务 SFS

实施步骤 - 弹性文件服务 SFS

文件系统类型 - 弹性文件服务 SFS

操作流程 - 弹性文件服务 SFS

管理SFS Turbo文件系统与OBS桶的存储联动 - 弹性文件服务 SFS

弹性文件服务-功能总览 - 弹性文件服务 SFS

计费说明 - 弹性文件服务 SFS

例行维护 - 弹性文件服务 SFS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线