检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
监控 弹性文件服务监控指标说明 SFS Turbo监控指标说明 创建告警规则
文件共享 查看监控数据 登录管理控制台。 选择“管理与监管 > 云监控服务> 云服务监控 > 弹性文件服务 SFS”,在文件系统列表中,单击待查看监控数据的文件系统“操作”列下的“更多 > 查看监控指标”。 您可以选择监控指标项或者监控时间段,查看对应的弹性文件服务监控数据。 关于
EFS”,在文件系统列表中,单击待查看监控数据的文件系统“操作”列下的“查看监控指标”。 您可以选择监控指标项或者监控时间段,查看对应的SFS Turbo监控数据。 关于云监控的其他操作和更多信息,请参考《云监控服务用户指南》。 图1 SFS Turbo监控图表 父主题: 监控
监控安全风险 SFS提供基于云监控服务CES的资源监控能力,帮助用户监控账号下的文件存储系统的使用情况,执行自动实时监控、告警和通知操作。用户可以实时监控弹性文件服务的客户端连接数、带宽、IOPS、容量等信息。 关于SFS支持的监控指标,以及如何创建监控告警规则等内容,请参见监控。
根据需要可选择从模板导入或自定义创建。 说明: 当监控范围为指定资源时可选择从模板导入。 从模板导入 模板 选择需要导入的模板。 - 告警策略 触发告警规则的告警策略。 当资源类型选择站点监控、日志监控、自定义监控、具体的云服务时,告警策略为一个周期性的动作。当资源类型选择事件监控时,具体的事件为一个瞬间的操作动作,而不是周期性动作。
AITurbo AI场景加速 加速保存与加载checkpoint 父主题: SFS Turbo文件系统
创建文件系统 功能介绍 创建文件系统 URI PUT / 请求参数 表1 请求Header参数 参数 是否必选 参数类型 描述 Authorization 是 String 签名信息 Date 是 String 请求时间 x-obs-bucket-type 是 String 通过此消息头明确创建文件系统。
Turbo监控指标说明和创建告警规则。 SFS Turbo性能监控 您可以在CES云监控服务上监控和SFS Turbo文件系统的性能使用情况。当AI算力集群规模变大,大模型参数量变大,导致Checkpoint读加载时间变长时,或训练数据集加载由于存储读写带宽不足导致拖慢AI训练时,您可以对SFS
get_gpt_layer_with_transformer_engine_spec, ) #增加如下一行 from aiturbo.checkpoint.aiturbo_megatron_training_adaptor import megatron_checkpoint_adaptor stimer
加速保存与加载checkpoint 加速原理与安装AITurbo SDK 适配pytorch 父主题: AITurbo AI场景加速
端存储带宽的需求,加速大规模训练集群checkpoint快速恢复。 图2 加载checkpoint流程 安装AITurbo SDK 安装AITurbo SDK依赖包。 AITurbo SDK依赖rpyc,setproctitle,PyYAML,pathlib2等三方库,安装方式如下:
挂载文件系统 挂载NFS协议类型文件系统到云服务器(Linux) 挂载NFS协议类型文件系统到云服务器(Windows) 挂载CIFS协议类型文件系统到云服务器(Windows) 自动挂载文件系统
原因6:将CIFS类型的文件系统挂载至Linux操作系统的云服务器。 CIFS类型的文件系统不支持使用Linux操作系统的云服务器进行挂载。请使用Windows操作系统的云服务器进行挂载。 原因7:挂载的目标子目录不存在。 先将文件系统挂载至根目录上,完成创建子目录后,卸载文件系统,再重新将文件系统挂载至子目录上即可。
用户自定义文件系统的名称。 需全局唯一,不能与已有的通用文件系统名称重复,包括其他用户创建的通用文件系统。文件系统创建成功后,不支持修改名称。 删除通用文件系统后,需要等待30分钟才能创建同名通用文件系统。 只能由英文字母、数字、“_”和“-”组成,创建单个文件系统时输入长度小于
支持文件系统挂载的操作系统 已通过兼容性测试的操作系统如表1所示。 表1 支持文件系统挂载的操作系统列表 类型 版本范围 SFS容量型文件系统 通用文件系统 SFS Turbo文件系统 CentOS CentOS 5,6,7 for x86 √ √ √ Debian Debian
删除文件系统 功能介绍 删除文件系统 URI DELETE / 请求参数 表1 请求Header参数 参数 是否必选 参数类型 描述 Authorization 是 String 签名头域 Date 是 String 请求时间 Host 是 String 表明主机地址。如filesystem
管理文件系统 查看文件系统 删除文件系统
应用场景 近年来,AI快速发展并应用到很多领域中,AI新产品掀起一波又一波热潮,AI应用场景越来越多,有自动驾驶、大模型、AIGC、科学AI等不同行业。AI人工智能的实现需要大量的基础设施资源,包括高性能算力,高速存储和网络带宽等基础设施,即“大算力、大存力、大运力”的AI基础大设施底座,让算力发展不要偏斜。
File System),即网络文件系统。一种使用于分散式文件系统的协议,通过网络让不同的机器、不同的操作系统能够彼此分享数据。 share_type 是 String 文件系统类型,有效值为STANDARD或者PERFORMANCE。当文件系统正在创建时,该字段不返回。 SFS
删除文件系统 功能介绍 删除文件系统。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI DELETE /v1/{project_id}/sfs-turbo/shares/{share_id}