检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图1 保存checkpoint流程 加速加载checkpoint 在加载checkpoint的时候,利用内存快恢、checkpoint广播等技术,大大减少后端存储的带宽压力,提升加载效率。具体地,对于训练中进程级故障、硬件仍然健康的故障场景,主机侧客户端内存缓存仍会保留,本机
仅挂载至一种服务器系统的文件系统出现写入数据失败的情况。 可能原因 服务器的安全组配置不正确,需要与文件系统通信的端口未开放。 定位思路 前往安全组控制台查看目标服务器的端口开放情况,并正确配置。 解决方法 登录弹性云服务器控制台。 登录管理控制台。 单击管理控制台左上角的,选择区域。 选择“服务列表
题添加相关的订阅者,然后在添加告警规则的时候,您需要开启消息通知服务并选择创建的主题,这样在云服务发生异常时,云监控可以实时的将告警信息以广播的方式通知这些订阅者。 创建告警规则 登录管理控制台。 单击“管理与监管 > 云监控服务 > 云服务监控 > 弹性文件服务Turbo EFS
户能够像使用本机一样对保存在存储系统中的文件进行读、写、创建等操作。Windows客户端建议使用SMB协议。 请提交工单申请 全部(白名单开放) 文件系统管理 文件系统是SFS Turbo中存储文件的容器。SFS Turbo提供创建、查看、删除等基本功能,帮助您便捷的进行文件系统管理。
2051(TCP),2052(TCP),20048(UDP&TCP);如果未开放2049、20048的UDP,在挂载的时候虽然也可以使用,但是可能让挂载时间变长,可以在 mount 时指定 -o tcp 来避免挂载耗时长的问题。 对于SMB协议,则需要为这些端口添加入方向规则开放:445(TCP)。 父主题: 网络类
服务配额 什么是配额? 为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。如您最多可以创建多少个文件系统。 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域。 在页面右上角,选择“资源
速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 图1阐明了区域和可用区之间的关系。 图1 区域和可用区 目前,华为云已在全球多个地域开放云服务,您可以根据需求选择适合自己的区域和可用区。更多信息请参见华为云全球站点。 如何选择区域? 选择区域时,您需要考虑以下几个因素: 地理位置
工作负荷下低时延的需求。 某生物平台需要软件进行大量的基因测序,但业务处理步骤多,业务部署慢,流程复杂,效率低,易出错,所以自建集群跟不上业务发展。但自从使用了提供专业的高性能计算业务流程管理软件,依托云平台的海量计算资源和存储资源,充分结合云平台和高性能计算特点,大大降低初始投
Turbo:文件系统类型为“HPC型”,存储类型请根据存储容量和性能需求选择,AI场景建议选择250MB/s/TiB及以上的存储类型。 ModelArts:AI开发平台,采用多机多卡分布式训练。 VPC:虚拟私有云和子网。 算法及数据:准备AI训练需要的算法及数据集,如Swin-Transformer算法,及ImageNet21K数据集。
的安全责任在于保障其所提供的 IaaS、PaaS 和 SaaS 类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。 租户:负责云服务内部的安全,安全地使用云。
ion programming interface)管理方式或管理控制台方式均可访问高性能弹性文件服务。 API方式 如果用户需要将云服务平台上的高性能弹性文件服务集成到第三方系统,用于二次开发,请使用API方式访问高性能弹性文件服务,具体操作请参见《高性能弹性文件服务API参考》。
文件系统加密 扩容 用户可以通过执行扩容操作来增加文件系统的容量。 支持区域: 全部 扩容文件系统 监控 云监控服务为用户提供一个针对资源的立体化监控平台。通过云监控,您可以全面了解文件系统的使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。 支持区域: 全部 SFS Turbo监控指标说明
ECS 规格:8vCPUs | 16GB | c7.2xlarge.2 操作系统:Linux 区域:华北-北京四 VPC名称:VPC1 端口开放:22 弹性IP:xxx.xxx.xxx.xxx 已创建/mnt/dst的目录 操作步骤 登录弹性云服务器管理控制台。 登录已创建的本地服
自动分级到OBS,释放高性能存储空间用于接收新的热数据。 访问冷数据时SFS Turbo从OBS自动加载数据提升访问性能。 5 多AI开发平台、生态兼容 pytorch、mindspore等主流AI应用框架,kubernetes容器引擎、算法开发场景通过文件语义访问共享数据,无需适配开发。
Turbo中NFS协议需要的安全组端口,以免文件系统挂载失败。NFS协议所需要入方向的端口号为111、2049、2051、2052、20048。如您需要修改开放的端口,可以前往“网络控制台 > 访问控制 > 安全组”找到目标安全组进行修改即可。 - 标签(Tag) 可选参数。 您可以在创建文件系统
Turbo文件系统成功后,您需要使用云服务器来挂载该文件系统,以实现多个云服务器共享使用文件系统的目的。 以root用户登录弹性云服务器 ECS。可以通过管理控制台或跨平台远程访问工具(例如PuTTY)登录已购买的ECS。 安装NFS客户端。 安装NFS客户端。 执行如下命令查看系统(此处以CentOS为例)是否安装NFS软件包。