检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
可能因权限等问题导致挂载失败或读写异常。 access_modes String 挂载文件的访问权限,支持读写和只读两种方式,仅type为“obsfs”类型,该字段有效。可选值: ReadOnlyMany:只读方式 ReadWriteMany:读写方式(默认值) 表14 auto_stop字段数据结构说明
查如下几个OBS的权限设置。 当前账号具备OBS桶的读写权限(桶ACLs) 进入OBS管理控制台,选择当前自动学习项目使用的OBS桶,单击桶名称进入概览页。 在左侧菜单栏选择“访问权限控制>桶ACLs”,检查当前账号是否具备读写权限,如果没有权限,请联系桶的拥有者配置权限。 确保此OBS桶是非加密桶
能因权限等问题导致挂载失败或读写异常。 access_modes 否 String 挂载文件的访问权限,支持读写和只读两种方式,仅type为“obsfs”类型,该字段有效。可选值: ReadOnlyMany:只读方式 ReadWriteMany:读写方式(默认值) 表17 auto_stop字段数据结构说明
然后再下线旧版本实例。 滚动升级(扩实例) 需额外消耗部分实例资源用于滚动升级,扩实例越大,升级速度越快。 滚动升级(缩实例) 通过腾出部分实例资源用于滚动升级,缩实例数越大,升级速度越快,造成业务中断可能性越大。 图1 推理服务升级流程 推理服务更新升级的具体操作请参见升级服务。
libgoogle-glog-dev liblmdb-dev libatlas-base-dev librdmacm1 libcap2-bin libpq-dev mysql-common net-tools nginx openslide-tools openssh-client openssh-server
在输入框选择输入数据所在的路径,如图9所示。 图8 填写训练输入路径 选择挂载SFS路径时,下拉框只显示有权限的SFS路径,显示“只读”的文件夹只支持只读功能,不显示的读写均支持。可参考权限管理文档修改SFS Turbo权限。 图9 输入数据设置完成界面 设置训练输出路径:新建“output”文件夹设置为输出
检查OBS桶的ACLs设置 进入OBS管理控制台,查找对应的OBS桶,单击桶名称进入概览页。 在左侧菜单栏选择“访问权限控制>桶ACLs”,检查当前账号是否具备读写权限,如果没有权限,请联系桶的拥有者配置权限。 在左侧菜单栏选择“访问权限控制>桶策略”,检查当前OBS桶是否允许子用户访问。 检查训练作业的代码目录和启动文件地址
卷写入。 条带化:创建逻辑卷时指定条带化,当实际写入数据时会将连续的数据分成大小相同的块,然后依次存储在多个物理卷上,实现数据的并发读写从而提高读写性能。条带化模式的存储池不支持扩容。 新增规格 支持添加多个规格。限制如下: 添加的多个规格项中,不能有相同的规格。 选择多个规格的
能因权限等问题导致挂载失败或读写异常。 access_modes 否 String 挂载文件的访问权限,支持读写和只读两种方式,仅type为“obsfs”类型,该字段有效。可选值: ReadOnlyMany:只读方式 ReadWriteMany:读写方式(默认值) 表16 failed_reasons字段数据结构说明
作业训练失败。 实际存储空间足够,却依旧报错“No Space left on device”。 同一目录下创建较多文件,为了加快文件检索速度,内核会创建一个索引表,短时间内创建较多文件时,会导致索引表达到上限,进而报错。 触发条件和下面的因素有关: 文件名越长,文件数量的上限越小。
作业训练失败。 实际存储空间足够,却依旧报错“No Space left on device”。 同一目录下创建较多文件,为了加快文件检索速度,内核会创建一个索引表,短时间内创建较多文件时,会导致索引表达到上限,进而报错。 触发条件和下面的因素有关: 文件名越长,文件数量的上限越小
Flow、PyTorch等之上,使用MoXing API可让模型代码的编写更加简单、高效。 MoXing提供了一套文件对象API,可以用来读写OBS文件。 您可以通过MoXing API文档了解其与原生API对应关系,以及详细的接口调用示例,详细说明请参见MoXing文件操作。 示例代码:
在ModelArts的Notebook中,如何使用昇腾多卡进行调试? 在ModelArts的Notebook中使用不同的资源规格训练时为什么训练速度差不多? 在ModelArts的Notebook中使用MoXing时,如何进行增量训练? 在ModelArts的Notebook中如何查看GPU使用情况?
卷写入。条带化是指创建逻辑卷时指定条带化,当实际写入数据时会将连续的数据分成大小相同的块,然后依次存储在多个物理卷上,实现数据的并发读写从而提高读写性能。条带化模式的存储池不支持扩容。 数据盘:部分规格支持“添加普通数据盘”,挂载多个数据盘到资源池中。支持设置数据盘的“磁盘类型”、“大小”和“数量”。
Turbo 通过以下两种方式将下载到本地的模型文件上传至SFS Turbo中。方式一操作简单,但是数据传输速度比较慢,费时间。方式二操作相对方式一复杂一些,但是数据传输速度较快。 方式一:将已下载的模型文件通过SSH直接上传至SFS Turbo中。具体步骤如下: 进入到/mnt/
Turbo 通过以下两种方式将下载到本地的模型文件上传至SFS Turbo中。方式一操作简单,但是数据传输速度比较慢,费时间。方式二操作相对方式一复杂一些,但是数据传输速度较快。 方式一:将已下载的模型文件通过SSH直接上传至SFS Turbo中。具体步骤如下: 进入到/mnt/
更高。 DistributedDataParallel进行多机多卡训练的优缺点 通信更快:相比于DP,通信速度更快 负载相对均衡:相比于DP,GPU负载相对更均衡 运行速度快:因为通信时间更短,效率更高,能更快速地完成训练作业。 相关章节 创建单机多卡的分布式训练(DataPar
Turbo 通过以下两种方式将下载到本地的模型文件上传至SFS Turbo中。方式一操作简单,但是数据传输速度比较慢,费时间。方式二操作相对方式一复杂一些,但是数据传输速度较快。 方式一:将已下载的模型文件通过SSH直接上传至SFS Turbo中。具体步骤如下: 进入到/mnt/
Turbo 通过以下两种方式将下载到本地的模型文件上传至SFS Turbo中。方式一操作简单,但是数据传输速度比较慢,费时间。方式二操作相对方式一复杂一些,但是数据传输速度较快。 方式一:将已下载的模型文件通过SSH直接上传至SFS Turbo中。具体步骤如下: 进入到/mnt/
Turbo 通过以下两种方式将下载到本地的模型文件上传至SFS Turbo中。方式一操作简单,但是数据传输速度比较慢,费时间。方式二操作相对方式一复杂一些,但是数据传输速度较快。 方式一:将已下载的模型文件通过SSH直接上传至SFS Turbo中。具体步骤如下: 进入到/mnt/