检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击页面右上角的“费用”进入“费用中心”页面。 在“总览”页面可以查看到当前的欠费金额。 如果存在欠费,请及时充值。 更多关于欠费还款操作,请参考如何进行欠费还款。 有关订单、退订、优惠券、消费明细等更多信息请参考费用中心帮助文档。 父主题: SFS Turbo计费类问题
在SFS Turbo控制台页面开通自动续费 您可以在购买包年/包月文件系统页面开通自动续费,如图1所示。 图1 SFS Turbo文件系统自动续费配置 在续费管理页面开通自动续费 登录管理控制台。 单击“控制台”页面上方“费用”,在下拉菜单中选择“续费管理”。
401 Unauthorized 被请求的页面需要用户名和密码。 403 Forbidden 对被请求页面的访问被禁止。 404 Not Found 服务器无法找到被请求的页面。 405 Method Not Allowed 请求中指定的方法不被允许。
选择“服务列表 > 管理与监管 > 云审计服务”,进入云审计服务信息页面。 单击左侧导航树的“事件列表”,进入事件列表信息页面。 在过滤条件查询框中,依次选择“事件来源 > 资源类型 > 筛选类型”,单击“查询”按钮执行搜索,查看过滤结果。
管理SFS Turbo目录配额 概述 SFS Turbo目录配额功能可以帮助您轻松管理目录级配额,包括添加配额、修改配额、删除配额和查询配额。 目录配额中描述的所有目录为SFS Turbo中的目录,与挂载点无关。 前提条件 已创建文件系统。更多信息,请参见创建文件系统。 已根据业务场景
在页面右上角单击“创建文件系统”。 在创建文件系统页面,根据界面提示配置参数。 配置完成后,单击“立即创建”,完成文件系统创建。 Linux系统ECS挂载操作请参见挂载SFS Turbo文件系统到Linux云服务器。 登录头节点,将需要上传的基因测序文件上传到挂载的文件系统。
单击右上角的“创建训练作业”,进入“创建训练作业”页面,在该页面填写训练作业相关参数信息。 填写训练作业相关参数信息,以下配置项请按要求填写,其余参数配置请参考创建训练作业根据您的自身情况选择。 资源池:专属资源池,选择创建资源中创建的ModelArts资源池。
根据页面提示支付成功后,可返回文件系统列表,单击该文件系统名称,确认扩容后的总容量。 按需计费的SFS Turbo文件系统扩容 登录高性能弹性文件服务管理控制台。 在SFS Turbo文件系统列表中,单击需要扩容的SFS Turbo文件系统所在行的“扩容”,进入“扩容”页面。
您可以在备份页面,查看备份创建状态。当文件系统备份的“备份状态”变为“可用”时,表示备份创建成功。
在页面右上角单击“创建文件系统”。 在创建文件系统页面,根据界面提示配置参数。 配置完成后,单击“立即创建”,完成文件系统创建。 Linux系统ECS挂载操作请参见挂载SFS Turbo文件系统到Linux云服务器。
进入费用账单消费汇总页面。 选择“流水和明细账单 > 明细账单”,在如下图所示位置单击鼠标左键,复制资源ID。 图1 复制资源ID 登录管理控制台,选择“存储 > 弹性文件服务”。 进入文件系统列表页面。
根据页面提示,完成创建后,返回SFS Turbo文件系统列表页面。您可以看到SFS Turbo文件系统的“状态”显示为“可用”,表示SFS Turbo文件系统创建成功。如果“状态”为“创建失败”,请查看SFS Turbo创建失败处理。
在文件系统列表中,单击创建的HPC型文件系统名称,进入文件系统详情页面。 在“基本信息”页签,设置冷数据淘汰时间。 图1 设置冷数据淘汰时间 只有已经导出到OBS且满足淘汰时间的数据才会被淘汰。 父主题: 基本配置
单击“新增访问密钥”,进入“新增访问密钥”页面。 输入描述(可选),单击“确定”。 通过邮箱、手机或者虚拟MFA进行验证,输入对应的验证码。如果没有开启敏感操作保护,请跳过该步骤。 单击“立即下载”,浏览器自动下载访问密钥。 为防止访问密钥泄露,建议您将其保存到安全的位置。
在“API凭证”页面的项目列表中查看项目ID。 图1 查看项目ID 父主题: 附录
在文件系统列表中,单击创建资源中创建的HPC型文件系统,进入文件系统详情页面。 进入页签“绑定后端存储”,单击“绑定OBS桶”。 图1 绑定OBS桶 在右侧弹窗“绑定OBS桶”中,填写如下表所示参数。
您可以在“费用中心 > 总览”页面设置“可用额度预警”功能,当可用额度、通用代金券和现金券的总额度低于预警阈值时,系统自动发送短信和邮件提醒。当产生欠费后,请您及时充值使可用额度大于0。
通过AITurbo加速保存与加载checkpoint 背景 当前,大模型训练往往使用成百上千加速卡训练几周到几个月不等。在训练过程中,故障导致训练中断经常发生。训练程序一般采用周期checkpoint方案来将训练状态持久化到存储,当发生故障时,训练程序能恢复到故障之前的模型和优化器的状态继续训练
进入监控图表页面。 入口一:选择“存储 > 弹性文件服务”,在文件系统列表单击查看监控数据的文件系统“操作”列下的“监控”。
在“服务列表”中,选择“网络 > VPC终端节点”,进入终端节点页面。 在左侧导航栏,选择“VPC终端节点 > 终端节点”。 在终端节点界面,单击“购买终端节点”,创建连接DNS服务的终端节点。 选择“云服务 > com.myhuaweicloud.region.dns”。