检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
当前,大模型训练往往使用成百上千加速卡训练几周到几个月不等。在训练过程中,故障导致训练中断经常发生。训练程序一般采用周期 checkpoint方案来将训练状态持久化到存储,当发生故障时,训练程序能恢复到故障之前的模型和优化器的状态继续训练。原生Pytorch系框架在保存checkpo
专属弹性文件服务 专属弹性文件服务简介 专属弹性文件服务(SFS Turbo)是面向企业、政府、金融等客户,提供一个基于专属计算、专属存储资源池构建的共享文件存储。租户独享专属计算和专属资源池,与公共租户资源物理隔离,满足特定性能、应用及安全合规等要求,为客户提供可靠、便捷的云上“头等舱”。
共享路径实现数据共享。 虚拟私有云VPC VPC为弹性云服务器构建隔离的、用户自主配置和管理的虚拟网络环境,提升用户云中资源的安全性,简化用户的网络部署。 云服务器无法访问不在同一VPC下的文件系统,使用弹性文件服务时需将文件系统和云服务器归属于同一VPC下。 文件系统 文件系统
Turbo文件系统基于VPC的对等连接功能,实现跨账号访问。更多关于VPC对等连接功能信息和实现方法请参见VPC对等连接。 使用限制 一个文件系统最多可以添加20个可用的VPC,对于添加的VPC所创建的ACL规则总和不能超过400个。 如果已经在VPC控制台删除文件系统绑定的VPC,该VPC
网络类 是否支持跨VPC访问文件系统? 弹性文件服务支持跨区域挂载吗? VPC的安全组是否影响弹性文件服务的使用? 同时挂载至两个服务器的文件系统数据存在延时怎么办?
创建带企业项目ID的共享时,metadata中的键如下: 键 值类型 是否必选 说明 enterprise_project_id String 是 企业项目ID。 在租户开启企业项目功能的情况下,enterprise_project_id作为key,value为企业项目ID,给共享绑定企业项目ID。
(Project) 企业项目 (Enterprise Project) 创建文件系统 POST /v1/{project_id}/sfs-turbo/shares sfsturbo:shares:createShare 创建SFS Turbo实例时,需要vpc相关权限,包括校验vpc、子网、
网络配置 配置多VPC 配置多账号访问 配置DNS
的费用,适用于长期、稳定的业务需求。以下是一些适用于包年/包月计费模式的业务场景: 稳定业务需求:对于长期运行且资源需求相对稳定的业务,如企业官网、在线商城、博客等,包年/包月计费模式能提供较高的成本效益。 长期项目:对于周期较长的项目,如科研项目、大型活动策划等,包年/包月计费
Turbo默认只能被云上同一个VPC内的ECS/CCE访问,用户可通过云专线/VPN/对等连接等方式打通网络,实现多种访问方式。 云下或其他云访问: 云专线/VPN 云上同区域同一账号不同VPC: VPC对等连接 云上同区域跨账号访问: VPC对等连接 不同区域访问: 云连接 迁移数据分为两种网络条件,通过可访问公网的ECS直接挂载迁移。
s带宽,起步容量为16TiB,即16384GiB。 subnet_id 是 String 用户在VPC下面的子网的网络ID。 vpc_id 是 String 用户在某一区域下的VPC ID。 backup_id 否 String 备份ID,从备份创建文件系统时为必选。 tags 否
解决方法 原因1和原因2:网络状态不稳定;网络连接异常。 修复网络,网络修复完成后重新执行挂载。 成功=>处理结束。 失败=>原因3。 原因3:未购买VPC终端节点。 购买VPC终端节点操作请参见配置VPC终端节点。 成功=>处理结束。 失败=>原因4。 原因4:云服务器DNS配置
https://docs.openstack.org/api-ref/shared-file-system/。 使用企业项目功能时,关于SFS容量型API接口是否支持企业项目,请参考API授权项列表。 当本文描述内容与上述开源社区的描述不一致时,请以本文描述为准。 SFS容量型接口 表1
为文件系统创建普通用户可读写的子目录 方案概述 资源和成本规划 实施步骤
面向AI场景使用OBS+SFS Turbo的存储加速实践 方案概述 资源和成本规划 操作流程 实施步骤 常见问题
SFS授权项分类 查询API版本 权限 对应API接口 授权项 IAM项目 (Project) 企业项目 (Enterprise Project) 查询API版本(OpenStack原生) GET / - × × 查询API版本(OpenStack原生) GET /{api_version}/
通用文件系统授权项分类 文件共享 表1 文件共享权限项列表 权限 对应API接口 授权项 IAM项目 (Project) 企业项目 (Enterprise Project) 创建文件系统 PUT /{file-system-name} sfs3:fileSystem:createFileSystem
弹性文件服务数据迁移 方案概述 通过云专线迁移(rclone工具) 跨服务器迁移(rclone工具) 通过云专线迁移(rsync工具) 文件系统之间迁移数据 SFS容量型文件系统迁移至其他文件系统
如果支付时间晚于指定生效时间,资源包将在支付后立即生效。 企业项目 勾选“限定企业项目使用”可限定企业项目使用资源包,即仅在所选企业项目下的通用文件系统才能使用此资源包进行抵扣,同时也需满足资源包所属区域匹配的要求。如果未限定则全部企业项目均可使用。该选项仅对企业账号展示。 资源包示意 根据以上配置显
Server 2012版本的弹性云服务器。 单击左下角“这台电脑”,弹出“这台电脑”界面。 右键单击“网络”,选择“属性”。弹出“网络和共享中心”,如图3所示。选择“本地连接”。 图3 网络和共享中心 在“活动”区域,选择“属性”。如图4所示。 图4 本地连接活动 弹出“本地连接属性”对话框,选择“Internet