检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过AITurbo加速保存与加载checkpoint 背景 当前,大模型训练往往使用成百上千加速卡训练几周到几个月不等。在训练过程中,故障导致训练中断经常发生。训练程序一般采用周期checkpoint方案来将训练状态持久化到存储,当发生故障时,训练程序能恢复到故障之前的模型和优化
弹性文件服务监控指标说明 功能说明 本节定义了弹性文件服务上报用户请求次数的监控指标的命名空间,监控指标列表和维度定义,用户可以通过管理控制台或云监控提供的API接口来查询监控指标。 命名空间 SYS.SFS 监控指标 表1 SFS容量型(已售罄)支持的监控指标 指标ID 指标名称
按需计费 按需计费是一种先使用再付费的计费模式,适用于无需任何预付款或长期承诺的用户。本文将介绍按需计费SFS资源的计费规则。 适用场景 按需计费适用于具有不能中断的短期、突增或不可预测的应用或服务,例如电商抢购、临时测试、科学计算。 适用计费项 SFS容量型 默认为按需计费模式
SFS Turbo监控指标说明 功能说明 本节定义了弹性文件服务Turbo上报云监控的监控指标的命名空间,监控指标列表和维度定义,用户可以通过管理控制台或云监控提供的API接口来查询监控指标。 命名空间 SYS.EFS 监控指标 表1 弹性文件服务Turbo支持的监控指标 指标ID
文件系统挂载失败 现象描述 使用mount命令挂载文件系统到云服务器,云服务器提示“access denied”,挂载失败。 可能原因 原因1:文件系统已被删除。 原因2:执行挂载命令的云服务器和被挂载的文件系统不在同一VPC下。 原因3:挂载命令中的挂载地址输入错误。 原因4:使用虚拟IP访问弹性文件服务。
包年/包月 适用场景 包年/包月计费模式需要用户预先支付一定时长的费用,适用于长期、稳定的业务需求。以下是一些适用于包年/包月计费模式的业务场景: 稳定业务需求:对于长期运行且资源需求相对稳定的业务,如企业官网、在线商城、博客等,包年/包月计费模式能提供较高的成本效益。 长期项目
欠费说明 用户在使用云服务时,账户的可用额度小于待结算的账单,即被判定为账户欠费。欠费后,可能会影响云服务资源的正常运行,请及时充值。 欠费原因 购买了按需计费弹性文件服务,并使用了一段时间后,账户的余额不足。 欠费影响 包年/包月 对于包年/包月SFS资源,用户已经预先支付了资