搜索_华为云

分布式训练功能介绍 - AI开发平台ModelArts

本文档提供的调测代码是以PyTorch为例编写的，不同的AI框架之间，整体流程是完全相同的，只需要修改个别的参数即可。 DataParallel进行单机多卡训练的优缺点代码简单：仅需修改一行代码。通信瓶颈：负责reducer的GPU更新模型参数后分发到不同的GPU，因此有较大的通信开销。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

下步骤排查。解决方案排查/home/ma-user权限，建议将该目录权限设置为755或750，权限不能过于宽松，以保证用户隔离和安全。修改方法如下。 chomd 755 /home/ma-user chomd 750 /home/ma-user 排查密钥是否是和实例绑定的一致。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
实例故障 - AI开发平台ModelArts
实例故障 - AI开发平台ModelArts

创建Notebook失败，查看事件显示JupyterProcessKilled 创建Notebook实例后无法打开页面，如何处理？使用pip install时出现“没有空间”的错误出现“save error”错误，可以运行代码，但是无法保存出现ModelArts.6333错误，如何处理？

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
查询标注团队成员详情 - AI开发平台ModelArts

请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 create_time Long 创建时间。 description String 标注成员描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 email String 标注成员邮箱。 role

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练脚本参数说明 - AI开发平台ModelArts

安装模型运行环境 └── qwen-vl.patch # 使用git apply修改模型相关代码父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
使用AWQ量化工具转换权重 - AI开发平台ModelArts

方式二：使用AutoAWQ量化工具进行量化。 1、运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers 4.42以上 python examples/quantize

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
管理和查看数据处理任务 - AI开发平台ModelArts

处理”，进入“数据处理”页面。在数据处理列表中，单击数据处理任务名称，进入数据处理任务的版本管理页面。您可以在该页面进行数据处理任务的“修改”与“删除”。图1 数据处理版本管理页面您可以在版本管理页面，通过切换页签查看“配置信息”、“日志”和“结果展示”。图2 日志页面图3

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
使用JupyterLab在线开发和调试代码 - AI开发平台ModelArts

Lab的使用具体参见JupyterLab常用功能介绍。如果您的代码文件是.py格式，请新打开一个.ipynb文件，执行%load main.py命令将.py文件内容加载至.ipynb文件后进行编码、调试等。图5 打开代码文件在JupyterLab中直接调用ModelArts提供的SDK，创建训练作业，上云训练。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

thQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools目录下。代码目录如下: AutoSmoothQuant #量化工具 ├── ascend_aut

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

本章节介绍如何使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools目录下。代码目录如下: AutoSmoothQuant #量化工具 ├── ascend_aut

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

thQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools目录下。代码目录如下: AutoSmoothQuant #量化工具 ├── ascend_aut

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
自动学习训练作业失败 - AI开发平台ModelArts

可单击“默认加密”选项进行修改。图1 OBS桶是否加密确保归档数据直读功能关闭进入OBS管理控制台，选择当前自动学习项目使用的OBS桶，单击桶名称进入概览页。确保此OBS桶的归档数据直读功能关闭。如果此功能开启，可单击“归档数据直读”选项进行修改。图2 关闭归档数据直读功能

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
查询插件模板 - AI开发平台ModelArts

npuDriver：NPU驱动 gpuDriver：GPU驱动 ccePlugin：CCE插件 helm：Helm模板 icAgent：ICAgent工具 description String 插件模板描述。 versions Map<String,PluginTemplateVersion> 插件模板版本描述信息。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

级到最新版本。支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）
管理AI Gallery数据集 - AI开发平台ModelArts

一起同步至运行平台。数据集描述 - 资产的README内容，支持添加资产的简介、使用场景、使用方法等信息。编辑完成后，单击“确认”保存修改。管理数据集文件预览文件在数据集详情页，选择“数据集文件”页签。单击文件名称即可在线预览文件内容。仅支持预览大小不超过10MB、格式为文本类或图片类的文件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
训练脚本存放目录说明 - AI开发平台ModelArts

安装模型运行环境 └── qwen-vl.patch # 使用git apply修改模型相关代码父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
创建处理任务 - AI开发平台ModelArts

ProcessorDataSource object 数据来源，与inputs二选一。数据源路径不支持设置为KMS加密桶中的OBS路径。 description 否 String 数据处理任务描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 inputs 否 Array of ProcessorDataSource

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

单击资源池名称，进入资源池详情。单击左侧“AI组件管理 > AI诊断”。单击“诊断”，选择“日志上传路径”和NCCL Test节点，其余参数可保持默认值或根据实际需求修改。测试使用的最大数据：取值范围[1, 1024]，单位可选为“B”、“KB”、“MB”、“GB”“TB”。测试使用的最大数据须大于开始测试使用的最小数据。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Cluster
查询服务列表 - AI开发平台ModelArts

service结构参数参数类型描述 service_id String 服务ID。 service_name String 服务名称。 description String 服务描述。 tenant String 服务归属租户。 project String 服务归属项目。 owner String

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
准备Notebook（可选） - AI开发平台ModelArts

打开已创建的Notebook实例，选择Notebook的python-3.9.10，即可编辑Untitled.ipynb文件。编写以下代码，并运行Untitled.ipynb文件（用于将OBS中的数据导入至云硬盘EVS）。 import moxing as mox #obs存放数据路径

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作

总条数： 1472

上一页
1
...
65
66
67
...
74
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分布式训练功能介绍 - AI开发平台ModelArts

报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

实例故障 - AI开发平台ModelArts

查询标注团队成员详情 - AI开发平台ModelArts

训练脚本参数说明 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

管理和查看数据处理任务 - AI开发平台ModelArts

使用JupyterLab在线开发和调试代码 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

查询插件模板 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

管理AI Gallery数据集 - AI开发平台ModelArts

训练脚本存放目录说明 - AI开发平台ModelArts

创建处理任务 - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

准备Notebook（可选） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线