搜索_华为云

使用VS Code创建并调试训练作业 - AI开发平台ModelArts

在输入框选择输入数据所在的路径，如图9所示。图8 填写训练输入路径选择挂载SFS路径时，下拉框只显示有权限的SFS路径，显示“只读”的文件夹只支持只读功能，不显示的读写均支持。可参考权限管理文档修改SFS Turbo权限。图9 输入数据设置完成界面设置训练输出路径：新建“output”文件夹设置为输出

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
从OBS目录导入数据规范说明 - AI开发平台ModelArts

<filename>bike_1_1593531469339.png</filename> <source> <database>Unknown</database> </source> <size> <width>554</width>

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
ModelArts中提示OBS相关错误 - AI开发平台ModelArts

检查OBS桶的ACLs设置进入OBS管理控制台，查找对应的OBS桶，单击桶名称进入概览页。在左侧菜单栏选择“访问权限控制>桶ACLs”，检查当前账号是否具备读写权限，如果没有权限，请联系桶的拥有者配置权限。在左侧菜单栏选择“访问权限控制>桶策略”，检查当前OBS桶是否允许子用户访问。检查训练作业的代码目录和启动文件地址

 帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
查看诊断报告 - AI开发平台ModelArts

发，以及是否存在计算快慢卡和下发快慢卡。如下图所示，可以看到8号卡的计算耗时明显大于其他卡，因此8号卡的“短板效应”将会拖慢集群的整体训练速度，后续性能分析需要重点关注8号卡的计算维度。图4 多卡不同step计算、下发和通信耗时统计值图5 多卡不同step通信带宽统计值环境变量Environment

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
查询开发环境实例列表 - AI开发平台ModelArts

能因权限等问题导致挂载失败或读写异常。 access_modes 否 String 挂载文件的访问权限，支持读写和只读两种方式，仅type为“obsfs”类型，该字段有效。可选值： ReadOnlyMany：只读方式 ReadWriteMany：读写方式（默认值）表16 failed_reasons字段数据结构说明

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
Standard自动学习 - AI开发平台ModelArts

支持图片分类、物体检测、预测分析、声音分类场景自动执行模型开发、训练、调优和推理机器学习的端到端过程根据最终部署环境和开发者需求的推理速度，自动调优并生成满足要求的模型 ModelArts自动学习，为资深级用户提供模板化开发能力提供“自动学习白盒化”能力，开放模型参数、自动生成模型，实现模板化开发，提高开发效率

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
Lite Cluster资源开通 - AI开发平台ModelArts

卷写入。条带化是指创建逻辑卷时指定条带化，当实际写入数据时会将连续的数据分成大小相同的块，然后依次存储在多个物理卷上，实现数据的并发读写从而提高读写性能。条带化模式的存储池不支持扩容。数据盘：部分规格支持“添加普通数据盘”，挂载多个数据盘到资源池中。支持设置数据盘的“磁盘类型”、“大小”和“数量”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
精度调优前准备工作 - AI开发平台ModelArts

影响模型收敛程度，决定了模型在每次更新权重时所采用的步长。学习率过高，模型可能会过度调整权重，导致不稳定的训练过程；如果学习率过低，模型训练速度会变慢，甚至陷入局部最优。 batch size 影响训练速度，有时候也会影响模型精度。 micro batch size 影响流水线并行中设备的计算效率。切分策略包括DP（Data

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

Flow、PyTorch等之上，使用MoXing API可让模型代码的编写更加简单、高效。 MoXing提供了一套文件对象API，可以用来读写OBS文件。您可以通过MoXing API文档了解其与原生API对应关系，以及详细的接口调用示例，详细说明请参见MoXing文件操作。示例代码：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
配置Lite Cluster存储 - AI开发平台ModelArts

Pod删除后，存储不会清理。使用主机路径 OBS 适用于训练数据集的存储。对象存储。常用OBS SDK进行样本数据下载。存储量大，但是离节点比较远，直接训练速度会比较慢，通常会先将数据拉取到本地cache，然后再进行训练任务。静态挂载动态挂载 SFS Turbo 适用于海量小文件业务场景。提供posix协议的文件系统；

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
实时推理的部署及使用流程 - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务：使用VPC直连的高速访问通道，用户的业务请求不需要经过推理平台，而是直接经VPC对等连接发送到实例处理，访问速度更快。在线服务的API默认为HTTPS访问，同时还支持以下的传输协议：使用WebSocket协议的方式访问在线服务：WebSocket

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
创建生产训练作业 - AI开发平台ModelArts

须配置“作业日志路径”，用于存放训练作业产生的日志文件。建议选择一个空的OBS文件目录存放运行中产生的日志文件，同时需要OBS文件目录的读写权限。事件通知选择是否打开“事件通知”开关。开关关闭（默认关闭）：表示不启用消息通知服务。开关打开：表示订阅消息通知服务，当训练作

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
查看训练作业资源占用情况 - AI开发平台ModelArts

读取和数据增强的性能，例如将数据读取并行化，或者使用NVIDIA Data Loading Library（DALI）等工具提高数据增强的速度。模型保存不要太频繁：模型保存操作一般会阻塞训练，如果模型较大，并且较频繁地进行保存，就会影响GPU/NPU利用率。同理，其他非GPU/

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
advisor调优总体步骤 - AI开发平台ModelArts

个目录下才能进行性能分析，这个操作相对较为繁琐且耗时。使用ModelArts时推荐挂载共享网盘如sfs turbo，既能加快训练数据的读取速度又能用于存放性能profiling数据。如果没有共享网盘，profiling数据默认保存到ModelArts训练容器中，则请参考创建Mod

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

cn/anaconda/cloud\n msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud\n bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud\n menpo:

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
MoXing进阶用法的样例代码 - AI开发平台ModelArts

uint8), cv2.IMREAD_COLOR) 将一个不支持OBS路径的API改造成支持OBS路径的API pandas中对h5的文件读写to_hdf和read_hdf既不支持OBS路径，也不支持输入一个文件对象，考虑以下代码会出现错误。 1 2 3 4 import pandas

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

modelarts:sfsOption 设置用户对于SFS Turbo文件夹的权限类型，支持填写以下参数：仅读权限：readonly 读写权限：readwrite（创建开发环境实例modelarts:notebook:create仅支持配置readwrite）如果需要在一个

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

如文件大小小于/cache目录大小并且文件数量超过50w，则考虑为inode不足或者触发了操作系统的文件索引相关问题。需要：分目录处理，减少单个目录文件量。减慢创建文件的速度。如数据解压过程中，sleep 5s后再进行下一个数据的解压。如果训练作业的工作目录下有core文件生成，可以在启动脚本最前面加上如下代

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
推理精度测试 - AI开发平台ModelArts

ce。 tasks：评测数据集任务，比如openllm。 batch_size：输入的batch_size大小，不影响精度，只影响得到结果速度，默认使用auto，代表自动选择batch大小。 output_path：结果保存路径。使用lm-eval，比如加载非量化或者awq量化，llama3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
推理精度测试 - AI开发平台ModelArts

ce。 tasks：评测数据集任务，比如openllm。 batch_size：输入的batch_size大小，不影响精度，只影响得到结果速度，默认使用auto，代表自动选择batch大小。 output_path：结果保存路径。使用lm-eval，比如加载非量化或者awq量化，llama3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）

总条数： 203

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用VS Code创建并调试训练作业 - AI开发平台ModelArts

从OBS目录导入数据规范说明 - AI开发平台ModelArts

ModelArts中提示OBS相关错误 - AI开发平台ModelArts

查看诊断报告 - AI开发平台ModelArts

查询开发环境实例列表 - AI开发平台ModelArts

Standard自动学习 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

精度调优前准备工作 - AI开发平台ModelArts

如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

配置Lite Cluster存储 - AI开发平台ModelArts

实时推理的部署及使用流程 - AI开发平台ModelArts

创建生产训练作业 - AI开发平台ModelArts

查看训练作业资源占用情况 - AI开发平台ModelArts

advisor调优总体步骤 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

MoXing进阶用法的样例代码 - AI开发平台ModelArts

给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线