检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
AI人工智能的实现需要大量的基础设施资源,包括高性能算力,高速存储和网络带宽等基础设施,即“大算力、大存力、大运力”的AI基础大设施底座,让算力发展不要偏斜。
后端有5min的缓存时间,查询的数据可能有延迟。
或者购买新规格的SFS Turbo文件系统后,完成文件系统之间的数据迁移,再将原文件系统删除/退订即可。 父主题: 其他类
配置SFS Turbo数据自动导出到OBS桶。 配置SFS Turbo数据淘汰策略。 4 训练 上传数据至OBS并预热到SFS Turbo中。 创建训练任务。
参考《弹性云服务器快速入门》中的“购买弹性云服务器”章节购买ECS,同时将ECS归属到已创建的VPC下。 步骤一:创建SFS Turbo文件系统 文件系统是SFS Turbo中存储文件的容器。您需要先创建一个SFS Turbo文件系统,然后才能在SFS Turbo中存储数据。
文件系统挂载时提示wrong fs type, bad option 现象描述 使用mount命令将文件系统挂载至Linux云服务器时,提示wrong fs type, bad option。 可能原因 Linux云服务器系统未安装NFS客户端,用户在执行挂载命令前未自行安装nfs-utils
如何将SFS Turbo部署至CCE? 请根据实际的业务情况,阅读存储管理-CSI-存储概述或存储管理-Flexvolume-极速文件存储卷,并在CCE界面完成部署操作。 父主题: 其他类
删除目标文件夹quota 功能介绍 删除目标文件夹quota。 接口约束 只支持对空目录进行删除quota。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI DELETE
使用CES监控SFS Turbo文件系统 监控指标说明 创建告警规则 父主题: 监控与审计
使用CTS审计SFS Turbo文件系统 支持审计的关键操作 查询SFS Turbo审计事件 父主题: 监控与审计
服务的访问控制 SFS Turbo对接了IAM服务,支持给企业中的员工设置不同的访问权限功能,以达到不同员工之间的权限隔离,用户可以通过IAM服务进行精细化的资源管控。详情请参见SFS Turbo的权限策略。 SFS Turbo支持通过IAM权限进行访问控制。 表1 SFS Turbo
当AI算力集群规模变大,大模型参数量变大,导致Checkpoint读加载时间变长时,或训练数据集加载由于存储读写带宽不足导致拖慢AI训练时,您可以对SFS Turbo进行性能扩容,以缩短数据加载时长。详情可参见SFS Turbo监控指标说明和创建告警规则。
单击“管理与监管 > 云监控服务 > 云服务监控 > 弹性文件服务Turbo EFS > 资源详情” 。 选择目标文件系统,单击“操作”列下的“创建告警规则”。 在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置规则信息参数。
当客户端与服务端之间网络延迟较高(例如在线下IDC访问云上NFS文件系统和跨Region挂载NFS文件系统的场景下),且您需要达到较高的带宽或IOPS时,建议开启该功能; 开启nconnect后对于单并发、小IO数据块等场景会有一定的时延增加,当您的业务为小并发的延迟敏感型时,不建议开启该功能
训练 上传数据至OBS并预热到SFS Turbo中 创建训练任务 父主题: 实施步骤
面向AI场景使用OBS+SFS Turbo的存储加速实践 方案概述 资源和成本规划 操作流程 实施步骤 常见问题
自动挂载文件系统 为避免已挂载SFS Turbo文件系统的云服务器重启后,挂载信息丢失,您可以在云服务器设置重启时进行自动挂载。 限制说明 部分CentOS系统的云服务器由于管理启动项的机制(服务启动顺序)不同,可能不支持以下自动挂载方案。此时,请手动挂载。 Linux系统操作步骤
后端有5min的缓存时间,查询的数据可能有延迟。
算法及数据:准备AI训练需要的算法及数据集,如Swin-Transformer算法,及ImageNet21K数据集。 说明: 为了提供最佳加速性能,建议SFS Turbo HPC文件系统和ModelArts资源池就近选择在同一个Region的同一个可用区(AZ)。
基本配置 配置ModelArts和SFS Turbo间网络直通 配置SFS Turbo和OBS联动 配置SFS Turbo数据自动导出到OBS桶 配置SFS Turbo数据淘汰策略 父主题: 实施步骤