检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置SFS Turbo数据自动导出到OBS桶 配置自动导出后,训练过程中周期性写入SFS Turbo文件系统的Checkpoint模型文件会自动以异步方式导出到关联的OBS桶中进行长期保存,无需手工导出,异步导出方式不会占用上层训练任务时间。 SFS Turbo的自动导出功能当前
监控与审计 使用CES监控SFS Turbo文件系统 使用CTS审计SFS Turbo文件系统
SFS Turbo文件系统的HPC缓存型还可以按“带宽大小”来计费。了解每种计费项的计费因子、计费公式等信息,请参考计费项。 如需了解实际场景下的计费样例以及各计费项在不同计费模式下的费用计算过程,请参见计费样例。 续费 包年/包月高性能弹性文件服务在到期后会影响文件系统的正常运
名称管理 修改文件系统名称 父主题: API
该接口仅适用于HPC缓存型文件系统 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v1/{project_id}/sfs-turbo/shares/{share_id}/action
SFS Turbo文件系统的列表。 count Integer SFS Turbo文件系统的数量。 表5 ShareInfo 参数 参数类型 描述 action_progress ActionProgress object SFS Turbo文件系统的创建任务进度。文件系统正在创建时,返回该字段;否则不返回。
实施步骤 创建资源 基本配置 训练 例行维护 父主题: 面向AI场景使用OBS+SFS Turbo的存储加速实践
提升Linux操作系统单客户端访问SFS Turbo的性能 操作场景 nconnect是Linux操作系统下NFS客户端的挂载参数,开启后支持NFS客户端与服务端之间建立多条TCP连接来提升吞吐性能。 前提条件 Linux内核为5.3及以上版本。 当客户端与服务端之间网络延迟较高
云监控服务> 云服务监控 > 弹性文件服务Turbo EFS > 资源详情”,在文件系统列表中,单击待查看监控数据的文件系统“操作”列下的“查看监控指标”。 您可以选择监控指标项或者监控时间段,查看对应的SFS Turbo监控数据。 SFS Turbo监控图标如图1所示,关于云监控的其
SFS Turbo文件系统支持多可用区吗? 单个文件系统只能创建在一个可用区,比如可用区1,但是任何可用区都可以挂载访问。 文件系统不支持多可用区数据冗余,文件系统所在可用区不可用时,文件系统不可用。 父主题: 其他类
可以将SFS Turbo标准型升级为性能型吗? 不可以。SFS Turbo不同规格的文件系统之间暂不支持互相转换。 如果希望使用另一种规格的SFS Turbo文件系统,不再需要使用之前规格的文件系统,可以先将原文件系统删除/退订后,重新购买新规格的SFS Turbo文件系统。或者购买新规格的SFS
创建目标文件夹quota 更新目标文件夹quota 查询目标文件夹quota 删除目标文件夹quota 创建目录 查询目录是否存在 删除文件系统目录 查询目录资源使用情况 父主题: API
~ 2023/05/08 23:59:59 您需要为每个计费周期预先付费,每个计费周期中,文件系统的费用计算如下: 文件系统费用 = 文件系统单价 * 容量 * 购买时长 示例中的文件系统费用= 0.4元/GiB/月 * 500GiB * 1个月 = 200元 上述示例中的价格仅供
训练 上传数据至OBS并预热到SFS Turbo中 创建训练任务 父主题: 实施步骤
文件系统之间迁移数据 方案概述 用户可以将SFS容量型文件系统中的数据迁移至SFS Turbo文件系统中,也可以将SFS Turbo文件系统中的数据迁移至SFS容量型文件系统中,进行云上业务拓展。 此方案通过创建一台Linux操作系统的云服务器,来连接SFS容量型文件系统和SFS
监控安全风险 SFS Turbo提供基于云监控服务CES的资源监控能力,帮助用户监控账号下的文件存储系统的使用情况,执行自动实时监控、告警和通知操作。用户可以实时监控高性能弹性文件服务的客户端连接数、带宽、IOPS、容量等信息。 关于SFS Turbo支持的监控指标,以及如何创建监控告警规则等内容,请参见监控。
加速保存与加载checkpoint 加速原理与安装AITurbo SDK 适配pytorch 父主题: AITurbo AI场景加速
FS Turbo HPC型高性能文件系统加速AI训练任务,训练速度加快可以节省AI算力费用。 文件系统使用空间不足,可以扩容吗? SFS Turbo文件系统支持在线扩容,扩容过程中挂载文件系统可能失败,建议业务低峰期扩容。 父主题: 面向AI场景使用OBS+SFS Turbo的存储加速实践
单击页面右上角的“费用 > 续费管理”进入续费管理页面。 在“续费管理”页面,找到待续费的资源,单击操作列的“续费”。 根据页面提示完成支付。 支付成功后,系统自动扣除欠费。 更多关于续费的信息(自动续费、导出续费清单、变更资费等)请参考续费管理。 有关订单、退订、优惠券、消费明细等更多信息请参考费用中心帮助文档。
Megatron框架的适配需要提前安装好pytorch及其依赖。 Megatron改动示例 设置环境变量,命令如下所示: AITURBO_BACKUP_ENABLE = True 环境变量“AITURBO_BACKUP_ENABLE”用于配置是否开启内存副本,当对可靠性要求不高时可以不配置,默认为Fal