检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过AITurbo加速保存与加载checkpoint 背景 当前,大模型训练往往使用成百上千加速卡训练几周到几个月不等。在训练过程中,故障导致训练中断经常发生。训练程序一般采用周期checkpoint方案来将训练状态持久化到存储,当发生故障时,训练程序能恢复到故障之前的模型和优化
弹性文件服务会占用用户的哪些资源? 为保证文件系统能够正常使用,弹性文件系统将会占用用户以下资源。 SFS容量型文件系统: 创建NFS文件系统时,会在用户填写的安全组下,开通111、2049、2050、2051、2052端口的入规则。创建CIFS文件系统时,会在用户填写的安全组下
查询资源实例列表 功能介绍 使用标签过滤资源实例。优先按照资源创建时间倒序排序。 URI POST /v3/sfs/tms/{project_id}/file-systems/resource-instances/filter 参数说明 参数 是否必选 参数类型 描述 project_id
SFS Turbo性能测试 fio是一个开源的I/O压力测试工具,可以使用fio工具对SFS进行吞吐量和IOPS的性能测试。 前提条件 已在云服务器上安装fio工具。fio可从官网或GitHub下载。 注意和说明 测试性能依赖client和server之间的网络带宽及文件系统的容量大小。
查询资源实例数量 功能介绍 根据标签查询资源实例数量。 URI POST /v3/sfs/tms/{project_id}/file-systems/resource-instances/count 参数说明 参数 是否必选 参数类型 描述 project_id 是 String
根据标签查询共享详情 功能介绍 根据标签查询共享实详情。 URI POST /v2/{project_id}/sfs/resource_instances/action 参数说明 参数 是否必选 参数类型 描述 project_id 是 String 操作用户的项目ID,获取方法请参见获取项目ID。
通过标签查询文件系统列表 功能介绍 通过标签查询文件系统列表 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v1/{project_id}/sfs-tu