搜索_华为云

创建训练任务 - 高性能弹性文件服务 SFS Turbo

创建训练任务基于SFS Turbo共享文件存储创建ModelArts训练任务。登录ModelArts管理控制台。在左侧导航栏中选择“训练管理 > 训练作业”，进入“训练作业”列表。单击右上角的“创建训练作业”，进入“创建训练作业”页面，在该页面填写训练作业相关参数信息。

帮助中心 > 高性能弹性文件服务 SFS Turbo > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤 > 训练
训练 - 高性能弹性文件服务 SFS Turbo

训练上传数据至OBS并预热到SFS Turbo中创建训练任务父主题：实施步骤

 帮助中心 > 高性能弹性文件服务 SFS Turbo > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤
面向AI场景使用OBS+SFS Turbo的存储加速方案概述 - 高性能弹性文件服务 SFS Turbo

面向AI场景使用OBS+SFS Turbo的存储加速方案概述应用场景近年来，AI快速发展并应用到很多领域中，AI新产品掀起一波又一波热潮，AI应用场景越来越多，有自动驾驶、大模型、AIGC、科学AI等不同行业。AI人工智能的实现需要大量的基础设施资源，包括高性能算力，高速存储

 帮助中心 > 高性能弹性文件服务 SFS Turbo > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
如何调用API - 高性能弹性文件服务 SFS Turbo

如何调用API 构造请求认证鉴权返回结果

 帮助中心 > 高性能弹性文件服务 SFS Turbo > API参考
通过AITurbo加速保存与加载checkpoint - 高性能弹性文件服务 SFS Turbo

通过AITurbo加速保存与加载checkpoint 背景当前，大模型训练往往使用成百上千加速卡训练几周到几个月不等。在训练过程中，故障导致训练中断经常发生。训练程序一般采用周期checkpoint方案来将训练状态持久化到存储，当发生故障时，训练程序能恢复到故障之前的模型和优化

 帮助中心 > 高性能弹性文件服务 SFS Turbo > 用户指南
配置ModelArts和SFS Turbo间网络直通 - 高性能弹性文件服务 SFS Turbo

配置ModelArts网络关联SFS Turbo ModelArts网络关联SFS Turbo后，可直接在ModelArts的Notebook开发及训练环境中挂载SFS Turbo共享文件系统，并访问其中的数据。登录ModelArts管理控制台，创建网络并打通创建资源中创建的创建虚拟私有

 帮助中心 > 高性能弹性文件服务 SFS Turbo > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤 > 基本配置
配置SFS Turbo数据自动导出到OBS桶 - 高性能弹性文件服务 SFS Turbo

配置SFS Turbo数据自动导出到OBS桶配置自动导出后，训练过程中周期性写入SFS Turbo文件系统的Checkpoint模型文件会自动以异步方式导出到关联的OBS桶中进行长期保存，无需手工导出，异步导出方式不会占用上层训练任务时间。 SFS Turbo的自动导出功能当前处于受限

 帮助中心 > 高性能弹性文件服务 SFS Turbo > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤 > 基本配置
上传数据至OBS并预热到SFS Turbo中 - 高性能弹性文件服务 SFS Turbo

将数据从OBS预热到SFS Turbo中 SFS Turbo HPC型文件系统绑定OBS桶后，可以使用数据预热功能，以减少后续训练首次访问数据耗时。训练任务开始前可通过数据预热功能将文件元数据和数据内容全部从OBS导入到SFS Turbo高性能文件存储中，数据预热功能的具体操作请参考创建SFS

帮助中心 > 高性能弹性文件服务 SFS Turbo > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤 > 训练
常见问题 - 高性能弹性文件服务 SFS Turbo

可以只使用SFS Turbo HPC型文件系统支撑AI训练吗？当数据规模较小，不存在冷热数据分级降本诉求，又希望能方便快捷的构建AI训练系统时，可以选择只使用SFS Turbo高性能文件存储支撑AI训练。可以基于OBS对象存储支撑AI自动驾驶、大模型训练吗？ OBS为容量型存储，在时延、带

 帮助中心 > 高性能弹性文件服务 SFS Turbo > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
资源和成本规划 - 高性能弹性文件服务 SFS Turbo

资源规划 OBS：存放训练数据集、预训练模型等数据资源的桶，桶存储类别为“标准存储”，桶策略为“私有”。 SFS Turbo：文件系统类型为“HPC型”，存储类型请根据存储容量和性能需求选择，AI场景建议选择250MB/s/TiB及以上的存储类型。 ModelArts：AI开发平台，采用多机多卡分布式训练。

帮助中心 > 高性能弹性文件服务 SFS Turbo > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
应用场景 - 高性能弹性文件服务 SFS Turbo

日志存储、文件共享、内容管理、网站 AI训练、自动驾驶、EDA仿真、渲染、企业NAS应用、高性能web应用 AI训练、自动驾驶、EDA仿真、渲染、企业NAS应用、高性能web应用大规模AI训练、AI大模型、AIGC 大规模AI训练、AI大模型、AIGC 表2 SFS Turbo上一代文件系统

 帮助中心 > 高性能弹性文件服务 SFS Turbo > 产品介绍
文件系统类型 - 高性能弹性文件服务 SFS Turbo

日志存储、文件共享、内容管理、网站 AI训练、自动驾驶、EDA仿真、渲染、企业NAS应用、高性能web应用 AI训练、自动驾驶、EDA仿真、渲染、企业NAS应用、高性能web应用大规模AI训练、AI大模型、AIGC 大规模AI训练、AI大模型、AIGC 表2 SFS Turbo上一代文件系统

 帮助中心 > 高性能弹性文件服务 SFS Turbo > 产品介绍
管理SFS Turbo文件系统与OBS桶的存储联动 - 高性能弹性文件服务 SFS Turbo

管理SFS Turbo文件系统与OBS桶的存储联动概述 AI训练和推理、高性能数据预处理、EDA、渲染、仿真等场景下，您可以通过SFS Turbo文件系统来加速OBS对象存储中的数据访问。SFS Turbo文件系统支持无缝访问存储在OBS对象存储桶中的对象。您可以指定SFS T

帮助中心 > 高性能弹性文件服务 SFS Turbo > 用户指南
创建资源 - 高性能弹性文件服务 SFS Turbo

请参考创建OBS桶。创建ModelArts资源池以常见的专属资源池为例，专属资源池提供独享的计算资源，可用于Notebook、训练作业、部署模型。专属资源池不与其他用户共享，更加高效。在使用专属资源池之前，您需要先创建一个专属资源池，操作指导请参考创建专属资源池。父主题：实施步骤

 帮助中心 > 高性能弹性文件服务 SFS Turbo > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤
实施步骤 - 高性能弹性文件服务 SFS Turbo

实施步骤创建资源基本配置训练例行维护父主题：面向AI场景使用OBS+SFS Turbo的存储加速实践

 帮助中心 > 高性能弹性文件服务 SFS Turbo > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
构造请求 - 高性能弹性文件服务 SFS Turbo

本节介绍REST API请求的组成，并以调用IAM服务的获取用户Token来说明如何调用API，该API获取用户的Token，Token可以用于调用其他API时鉴权。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987。

帮助中心 > 高性能弹性文件服务 SFS Turbo > API参考 > 如何调用API
操作流程 - 高性能弹性文件服务 SFS Turbo

操作流程本文档介绍面向AI场景如何使用OBS+SFS Turbo的存储加速，流程如图1所示。图1 面向AI场景使用OBS+SFS Turbo的存储加速方案步骤表1 面向AI场景使用OBS+SFS Turbo的存储加速流程说明序号步骤说明 1 规划组网和资源此步骤请提交工单联系技术支持人员进行支撑配置。

帮助中心 > 高性能弹性文件服务 SFS Turbo > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践
认证鉴权 - 高性能弹性文件服务 SFS Turbo

"********", //IAM用户密码 "domain": { "name": "domainname" //IAM用户所属账号名 }

帮助中心 > 高性能弹性文件服务 SFS Turbo > API参考 > 如何调用API
计费说明 - 高性能弹性文件服务 SFS Turbo

默认为按需计费模式。即按您购买时选择的存储容量和时长收费，而不是以实际的使用量收费。以小时为单位，按每小时整点结算。结算时，时长不足1小时的，按1小时计费。计费模型如表1所示。表1 计费模型计费项计费因子标准型、标准型-增强版（停售）、性能型、性能型-增强版（停售）、20MB/s/TiB、40MB/s/Ti

帮助中心 > 高性能弹性文件服务 SFS Turbo > 产品介绍
例行维护 - 高性能弹性文件服务 SFS Turbo

您可以在CES云监控服务上监控和SFS Turbo文件系统的性能使用情况。当AI算力集群规模变大，大模型参数量变大，导致Checkpoint读加载时间变长时，或训练数据集加载由于存储读写带宽不足导致拖慢AI训练时，您可以对SFS Turbo进行性能扩容，以缩短数据加载时长。详情可参见SFS

帮助中心 > 高性能弹性文件服务 SFS Turbo > 最佳实践 > 面向AI场景使用OBS+SFS Turbo的存储加速实践 > 实施步骤

总条数： 95

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建训练任务 - 高性能弹性文件服务 SFS Turbo

训练 - 高性能弹性文件服务 SFS Turbo

面向AI场景使用OBS+SFS Turbo的存储加速方案概述 - 高性能弹性文件服务 SFS Turbo

如何调用API - 高性能弹性文件服务 SFS Turbo

通过AITurbo加速保存与加载checkpoint - 高性能弹性文件服务 SFS Turbo

配置ModelArts和SFS Turbo间网络直通 - 高性能弹性文件服务 SFS Turbo

配置SFS Turbo数据自动导出到OBS桶 - 高性能弹性文件服务 SFS Turbo

上传数据至OBS并预热到SFS Turbo中 - 高性能弹性文件服务 SFS Turbo

常见问题 - 高性能弹性文件服务 SFS Turbo

资源和成本规划 - 高性能弹性文件服务 SFS Turbo

应用场景 - 高性能弹性文件服务 SFS Turbo

文件系统类型 - 高性能弹性文件服务 SFS Turbo

管理SFS Turbo文件系统与OBS桶的存储联动 - 高性能弹性文件服务 SFS Turbo

创建资源 - 高性能弹性文件服务 SFS Turbo

实施步骤 - 高性能弹性文件服务 SFS Turbo

构造请求 - 高性能弹性文件服务 SFS Turbo

操作流程 - 高性能弹性文件服务 SFS Turbo

认证鉴权 - 高性能弹性文件服务 SFS Turbo

计费说明 - 高性能弹性文件服务 SFS Turbo

例行维护 - 高性能弹性文件服务 SFS Turbo

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线