检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置SFS Turbo数据自动导出到OBS桶 配置自动导出后,训练过程中周期性写入SFS Turbo文件系统的Checkpoint模型文件会自动以异步方式导出到关联的OBS桶中进行长期保存,无需手工导出,异步导出方式不会占用上层训练任务时间。 SFS Turbo的自动导出功能当前处于受限
用担心存储资源扩容、缩容问题。OBS支持在线升级、在线扩容,升级扩容由华为云实施,客户无感知。同时提供全新的POSIX语言系统,应用接入更简便。 数据分层,按需使用:提供按量计费和包年包月两种支付方式,支持标准、低频访问存储、归档存储、深度归档数据(受限公测)独立计量计费,降低存储成本。
表1 存储类别对比 对比项目 标准存储 低频访问存储 归档存储 深度归档存储(受限公测) 特点 高性能、高可靠、高可用的对象存储服务 高可靠、较低成本的实时访问存储服务 归档数据的长期存储,存储单价更优惠 深度归档数据的长期存储,存储单价相比归档存储更优惠 应用场景 云应用、数据分享、内容分享、热点对象
同时存在标准存储类型的对象副本和归档或深度归档存储对象,在恢复对象的保存时间到期后标准存储类型的对象副本会自动删除。 该接口可以恢复指定桶中的归档存储对象。 接口约束 您必须是桶拥有者或拥有恢复归档或深度归档存储对象的权限,才能恢复归档或深度归档存储对象。建议使用IAM或桶策略进
桶和对象相关 创建桶失败 上传对象失败 下载对象失败 删除桶失败 删除对象失败 通过URL访问对象失败 如何在浏览器中在线预览OBS中的对象? 我可以修改对象名称吗? 我可以在线编辑OBS中的对象吗? 如何获取对象访问路径? 我可以修改桶所在的区域吗? 如何修改桶所属的企业项目? 我可以在桶间进行文件复制吗?
基于安全合规要求,华为云对象存储服务OBS禁止通过OBS的默认域名在线预览桶内对象,即使用分享链接从浏览器访问桶内对象(如视频、图片、网页等)时,不会显示对象内容,而是以附件形式下载。解决方案请参考:如何在浏览器中在线预览OBS中的对象? 父主题: 对象操作
单击“复制链接”,并将该链接分享给其他用户,用户可以在浏览器中通过此链接直接访问该对象。 通过浏览器访问对象,会强制下载对象,如果您希望被分享人可以在线预览对象,请参见如何在浏览器中在线预览OBS中的对象? 单击“复制路径”,并将该路径分享给拥有对象所在桶权限的用户,用户可以在对应桶的对象列表页中部的对象搜
如图所示,OBS支持通过生命周期实现以下场景的存储类别自动转换: 标准存储->低频访问存储、归档存储、深度归档存储 低频访问存储->归档存储、深度归档存储 归档存储->深度归档存储 执行生命周期规则时,OBS依据桶的多版本状态执行的转换操作如下: 未开启多版本的桶 开启多版本的桶 暂停多版本的桶
资源和成本规划 本节介绍最佳实践中资源规划情况,包含以下内容: 表1 资源和成本规划内容说明 维度 说明 资源规划 OBS:存放训练数据集、预训练模型等数据资源的桶,桶存储类别为“标准存储”,桶策略为“私有”。 SFS Turbo:文件系统类型为“HPC型”,存储类型请根据存储容
标准存储->深度归档存储 存储费用 转换为深度归档存储后,按深度归档存储计算存储费用。 低频访问存储->深度归档存储 存储费用 转换为深度归档存储后,按深度归档存储计算存储费用。 当低频访问存储早于30天转换为深度归档存储,需要补足剩余天数的低频存储费用。 归档存储->深度归档存储 存储费用
基于安全合规要求,华为云对象存储服务OBS禁止通过OBS的默认域名(桶访问域名或静态网站访问域名)在线预览桶内对象,即使用上述域名从浏览器访问桶内对象(如视频、图片、网页等)时,不会显示对象内容,而是以附件形式下载。 设置在线预览请参见如何在浏览器中在线预览OBS中的对象。 当前联邦子账号不支持在console界面创建style,如需创建请使用主账号。
实施步骤 创建资源 基本配置 训练 例行维护 父主题: 面向AI场景使用OBS+SFS Turbo的存储加速实践
适用数据量 要求 耗时 费用 OBS工具方式(在线) 不高于1TB的数据量 要求用户公网带宽空闲,需要人工操作客户端或脚本启动数据上传 家用100Mbps带宽,1TB耗时1天左右 数据传输不收取费用,仅OBS收取基本的存储费用 CDM方式(在线) 单次小于8TB的数据量 需要用户单独购买CDM服务
Administrator权限后才能删除DIS通知策略 设置在线解压策略 对象存储服务 OBS 需要增加Tenant Administrator权限后才能设置在线解压策略 获取在线解压策略 对象存储服务 OBS 需要增加Tenant Administrator权限后才能获取在线解压策略 删除在线解压策略 对象存储服务
Turbo和OBS联动。 配置SFS Turbo数据自动导出到OBS桶。 配置SFS Turbo数据淘汰策略。 4 训练 上传数据至OBS并预热到SFS Turbo中。 创建训练任务。 5 例行运维 使用OBS+SFS Turbo的存储加速方案的过程中,您可以进行采取以下运维措施,保证系统正常高效运行:
暂不支持并行文件系统 暂不支持多AZ 暂不支持低频存储、归档存储和深度归档存储 暂不支持归档数据直读 暂不支持碎片管理 暂不支持企业项目 暂不支持跨区域复制 暂不支持图片处理 暂不支持Data+(该功能已下线) 暂不支持数据回源 暂不支持在线解压 父主题: 基本概念
Turbo文件系统的性能使用情况。当AI算力集群规模变大,大模型参数量变大,导致Checkpoint读加载时间变长时,或训练数据集加载由于存储读写带宽不足导致拖慢AI训练时,您可以对SFS Turbo进行性能扩容,以缩短数据加载时长。详情可参见SFS Turbo监控指标说明和创建告警规则。
通过URL访问对象失败 本案例主要介绍对象URL无法访问的场景。如果您的问题是对象URL只能下载,而不能在线预览,请参考如何在浏览器中在线预览OBS中的对象?解决。 如果您是对象的拥有者,不能通过URL访问对象,请检查如下内容: 如果您是自定义对象的URL,请检查对象URL中是否
下载文件。如果您不希望暴露桶的默认域名或希望在浏览器中可以在线预览文件,那么您可以为桶绑定自定义域名,通过自定义域名访问桶中的文件。 使用场景 文件预览:如果您不想强制下载文件,可以通过将自定义域名绑定至OBS桶实现在线预览文件。 防止域名被拦截:一些应用平台可能会拦截桶默认域名
如,一个深度归档存储对象在OBS中存储了170天后删除,会按照180天计费。 数据恢复:深度归档存储需要先恢复才能访问。深度归档存储恢复方式有标准和加急两种,标准恢复耗时5~12 h,加急恢复耗时3~5 h。 存储类别对比 对比项目 标准存储 低频访问存储 归档存储 深度归档存储(受限公测)