搜索_华为云

大量数据文件，训练过程中读取数据效率低？ - AI开发平台ModelArts

BS中读取文件，导致训练过程一直在等待文件读取，效率低。解决方法建议将海量小文件，在本地压缩打包。例如打包成.zip格式。将此压缩后的文件上传至OBS。训练时，可直接从OBS下载此压缩文件至/cache目录。此操作仅需执行一次，无需训练过程反复与OBS交互导致训练效率低。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 训练过程读取数据
分布式Tensorflow无法使用“tf.variable” - AI开发平台ModelArts

variable is used in loss computation. 原因分析分布式Tensorflow不能使用“tf.variable”要使用“tf.get_variable”。处理方法请您将“启动文件”中的“tf.variable”替换为“tf.get_variable”。父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
infiniband驱动的安装 - AI开发平台ModelArts

0-ubuntu16.04-x86_64.tgz。宿主机安装的infiniband驱动版本为4.3-1.0.1.0，容器镜像中安装的infiniband驱动版本需要与宿主机版本匹配，即同为4.3-1.0.1.0。可能部分区域的网卡较新，会出现更高版本的infiniband驱动版本，如果您遇到了i

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
不同机型的对应的软件配套版本 - AI开发平台ModelArts

不同机型的对应的软件配套版本由于弹性集群资源池可选择弹性裸金属或弹性云服务器作为节点资源，不同机型的节点对应的操作系统、适用的CCE集群版本等不相同，为了便于您制作镜像、升级软件等操作，本文对不同机型对应的软件配套版本做了详细介绍。裸金属服务器的对应的软件配套版本表1 裸金属服务器

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
如何对OBS的文件重命名？ - AI开发平台ModelArts

如何对OBS的文件重命名？由于OBS管理控制台不支持对OBS的文件重命名，当您需要对OBS文件进行重命名时需要通过调用MoXing API实现，在已有的或者新创建的Notebook中，执行如下命令，通过接口对OBS中的文件进行重命名。具体操作如下：如下示例为将文件“obs_file

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 数据存储
Notebook中的EVS存储可以使用套餐包吗？ - AI开发平台ModelArts

Notebook中的EVS存储可以使用套餐包吗？无法使用套餐包。父主题：计费FAQ

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
日志提示“No space left on device” - AI开发平台ModelArts

line error"文档进行修复。如果是分布式作业有的节点有错误，有的节点正常，建议提工单请求隔离有问题的节点。如果是触发了欧拉操作系统的限制，有如下建议措施。分目录处理，减少单个目录文件量。减慢创建文件的速度。关闭ext4文件系统的dir_index属性，具体可参考：https://access

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
Notebook中的EVS存储可以使用套餐包吗？ - AI开发平台ModelArts

Notebook中的EVS存储可以使用套餐包吗？无法使用套餐包。父主题：计费相关

 帮助中心 > AI开发平台ModelArts > 常见问题 > 计费相关
如果不能删除labeler，能否删除将他的标注结果从整体标注结果中分离出来？ - AI开发平台ModelArts

er从标注任务中删除？删除后对标注结果有什么影响？如果不能删除labeler，能否删除将他的标注结果从整体标注结果中分离出来？目前不支持从标注任务中删除labeler。 labeler的标注必须通过审核后，才能同步到最终结果，不支持单独分离操作。父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
模型训练存储加速 - AI开发平台ModelArts

加载带来的I/O挑战，华为云提供了基于对象存储服务OBS+高性能弹性文件服务SFS Turbo的AI云存储解决方案，如下图所示。 SFS Turbo HPC型支持和OBS数据联动，您可以通过SFS Turbo HPC型文件系统来加速对OBS对象存储中的数据访问，并将生成的结果数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
在Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

在Notebook中，如何访问其他账号的OBS桶？创建Notebook时选择OBS存储，这种情况下只能访问到自己账号下的桶，无法访问到其他账号的OBS桶。如果需要在Notebook中，访问其他账号的OBS文件，前提是，需获取目标OBS桶的读写权限。首先，请联系OBS桶的创建者，参考对其他账号授予桶的读写权

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 数据存储
常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

常见的磁盘空间不足的问题和解决办法该章节用于统一整体所有的常见的磁盘空间不足的问题和解决办法。减少相关问题文档的重复内容。问题现象训练过程中复制数据/代码/模型时出现如下报错：图1 错误日志原因分析出现该问题的可能原因如下：本地数据、文件保存将"/cache"目录空间用完。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
如何使用pandas库处理OBS桶中的数据？ - AI开发平台ModelArts

如何使用pandas库处理OBS桶中的数据？参考下载OBS文件到Notebook中的指导，将OBS中的数据下载至Notebook本地处理。参考pandas用户指南处理pandas数据。父主题：数据存储

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 数据存储
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

Cluster资源池上使用Snt9B完成分布式训练任务场景描述本案例介绍如何在Snt9B上进行分布式训练任务，其中Cluster资源池已经默认安装volcano调度器，训练任务默认使用volcano job形式下发lite池集群。训练测试用例使用NLP的bert模型，详细代码和指导可参考Bert。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
如何在ModelArts上获得RANK_TABLE_FILE进行分布式训练？ - AI开发平台ModelArts

env | grep RANK 在训练作业中，您可以在训练启动脚本的首行加入如下代码，把RANK_TABLE_FILE的值打印出来： 1 os.system('env | grep RANK') 父主题：功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
MoXing进阶用法的样例代码 - AI开发平台ModelArts

通过重写pandas源码API的方式，将该API改造成支持OBS路径的形式。写h5到OBS = 写h5到本地缓存 + 上传本地缓存到OBS + 删除本地缓存从OBS读h5 = 下载h5到本地缓存 + 读取本地缓存 + 删除本地缓存即将以下代码写在运行脚本的最前面，就能使运行过程中的to_hdf和read_hdf支持OBS路径。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
训练过程中无法找到so文件 - AI开发平台ModelArts

directory 原因分析编译生成so文件的cuda版本与训练作业的cuda版本不一致。处理方法编译环境的cuda版本与训练环境不一致，训练作业运行就会报错。例如：使用cuda版本为10的开发环境tf-1.13中编译生成的so包，在cuda版本为9.0训练环境中tf-1

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练场景描述 ranktable路由规划是一种用于分布式并行训练中的通信优化能力，在使用NPU的场景下，支持对节点之间的通信路径根据交换机实际topo做网络路由亲和规划，进而提升节点之间的通信速度。本案例介绍如何在ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

-ks / --keep-storage Int 否清理缓存时保留的缓存大小，单位是MB，默认是0，表示全部清理。 -kd / --keep-duration String 否清理缓存时保留较新的缓存，只清除历史缓存，单位为s（秒）、m（分钟）、h（小时），默认是0s，表示全部清理。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
标注结果存储在哪里？ - AI开发平台ModelArts

详细数据以及标注信息。如需了解标注结果的存储路径，请参见如下说明。背景说明针对ModelArts中的数据集，在创建数据集时，需指定“数据集输入位置”和“数据集输出位置”。两个参数填写的均是OBS路径。 “数据集输入位置”即原始数据存储的OBS路径。 “数据集输出位置”，指在M

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理

总条数： 2153

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

大量数据文件，训练过程中读取数据效率低？ - AI开发平台ModelArts

分布式Tensorflow无法使用“tf.variable” - AI开发平台ModelArts

infiniband驱动的安装 - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

如何对OBS的文件重命名？ - AI开发平台ModelArts

Notebook中的EVS存储可以使用套餐包吗？ - AI开发平台ModelArts

日志提示“No space left on device” - AI开发平台ModelArts

Notebook中的EVS存储可以使用套餐包吗？ - AI开发平台ModelArts

如果不能删除labeler，能否删除将他的标注结果从整体标注结果中分离出来？ - AI开发平台ModelArts

模型训练存储加速 - AI开发平台ModelArts

在Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

如何使用pandas库处理OBS桶中的数据？ - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

如何在ModelArts上获得RANK_TABLE_FILE进行分布式训练？ - AI开发平台ModelArts

MoXing进阶用法的样例代码 - AI开发平台ModelArts

训练过程中无法找到so文件 - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

标注结果存储在哪里？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线