检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过AITurbo加速保存与加载checkpoint 背景 当前,大模型训练往往使用成百上千加速卡训练几周到几个月不等。在训练过程中,故障导致训练中断经常发生。训练程序一般采用周期checkpoint方案来将训练状态持久化到存储,当发生故障时,训练程序能恢复到故障之前的模型和优化
案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录SFS Turbo的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。
计费模式概述 高性能弹性文件服务提供包年/包月、按需计费两种计费模式,以满足不同场景下的用户需求。 包年/包月:一种预付费模式,即先付费再使用,按照订单的购买周期进行结算。购买周期越长,享受的折扣越大。一般适用于可预估资源使用周期的场景。 按需计费:一种后付费模式,即先使用再付费
-turbo/{share_id}/tags 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 操作用户的项目ID share_id 是 String 共享ID 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
-turbo/{share_id}/tags 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 操作用户的项目ID share_id 是 String 共享ID 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
ResourceTag objects 标签列表。 用户权限时该字段必选。如果有op_service权限时,tags和sys_tags二选一。 sys_tags 否 Array of ResourceTag objects 系统标签列表。 op_service权限可以访问,和tags二选一。目前TMS
管道文件数目 char Long 字符设备数目 block Long 块设备数目 socket Long 套接字数目 symlink Long 符号链接数目 状态码: 400 表6 响应Body参数 参数 参数类型 描述 errCode String 错误码 errMsg String 错误描述
管道文件数目 char Long 字符设备数目 block Long 块设备数目 socket Long 套接字数目 symlink Long 符号链接数目 状态码: 400 表8 响应Body参数 参数 参数类型 描述 errCode String 错误码 errMsg String 错误描述