搜索_华为云

无法导入模块 - AI开发平台ModelArts

module_dir ImportError: No module named xxx 原因分析训练作业导入模块时日志出现前两条报错信息，可能原因如下：代码如果在本地运行，需要将“project_dir”加入到PYTHONPATH或者将整个“project_dir”安装到“site-packa

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
日志提示“No space left on device” - AI开发平台ModelArts

com/solutions/29894，（可能会影响文件检索性能）。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者V

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

增加了和OBS交互工作的整个训练流程如下：建议使用OBSutil作为和OBS交互的工具，如何在本机安装obsutil可以参考obsutil安装和配置。训练数据、代码、模型下载。（本地使用硬盘挂载或者docker cp，在ModelArts上使用OBSutil）启动脚本，用法无切换，一般就是到达执行目录，然后python

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
ECS中构建新镜像 - AI开发平台ModelArts

Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压AscendCloud压缩包及该目录下的训练代码AscendCloud-LLM-xxx.zip，并直接进入到llm_train/AscendSpeed文件夹下面 cd ./llm_train/AscendSpeed

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Storage Service，简称OBS）存储输入输出数据、运行代码和模型文件，实现安全、高可靠和低成本的存储需求。因此，在使用ModelArts之前通常先创建一个OBS桶，然后在OBS桶中创建文件夹用于存放数据。本文档也以将运行代码存放OBS为例，请参考创建OBS桶，例如桶名：stan

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
预训练数据处理 - AI开发平台ModelArts

x-Ascend/llm_train/AscendSpeed/ModelLink/”目录，在代码目录中执行preprocess_data.py脚本处理数据。此处提供一段实际的数据处理代码示例如下。 #加载ascendspeed及megatron模型 export PYTHONP

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
ECS中构建新镜像 - AI开发平台ModelArts

Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压AscendCloud压缩包及该目录下的训练代码AscendCloud-LLM-6.3.908-xxx.zip，并直接进入到llm_train/AscendSpeed文件夹下面 unzip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
如何删除预置镜像中不需要的工具 - AI开发平台ModelArts

预置的基础镜像中存在cpp、gcc等调试/编译工具，如果您不需要使用这些工具，可以通过运行脚本删除。创建一个run.sh脚本文件，文件中的代码内容如下。然后在容器中执行sh run.sh命令运行脚本。 #!/bin/bash delete_sniff_compiler() {

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
服务启动失败 - AI开发平台ModelArts

需要检查两个地方：自定义镜像中的代码开放的端口和创建AI应用界面上配置的端口。确认两处端口保持一致。AI应用创建界面如果不填端口信息，则ModelArts会默认监听8080端口，即镜像代码中启用的端口必须是8080。图2 自定义镜像中的代码开放的端口图3 创建AI应用界面上配置的端口

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
Notebook使用场景 - AI开发平台ModelArts

另一方面，针对AI Gallery社区发布的Notebook样例（.ipynb格式文件），可直接在CodeLab中打开，查看他人分享的样例代码，具体请参见使用CodeLab免费体验Notebook。 ModelArts提供了云化版本的Notebook，无需关注安装配置，即开即用，具体参见创建Notebook实例。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

obs:object:GetObject obs:object:PutObject 训练作业启动前下载数据、模型、代码。训练作业运行中上传日志、模型。建议配置。操作步骤本案例场景为单机单卡场景下创建训练作业，数据和代码存储在OBS服务的并行文件系统下，创建自定义镜像训练作业。使用主用户账号登录管理控

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
服务管理概述 - AI开发平台ModelArts

这里的在线服务包括“predictor”和“transformer”两类，都包括下文描述的功能，本章节以“predictor”服务为例进行说明。本章节的示例代码都是在ModelArts Notebook中实现的，如果在其它开发环境使用，需要进行Session鉴权，请参见Session鉴权。父主题：

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
训练作业找不到GPU - AI开发平台ModelArts

device is detected 原因分析根据错误信息判断，报错原因为训练作业运行程序读取不到GPU。处理方法根据报错提示，请您排查代码，是否已添加以下配置，设置该程序可见的GPU： os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2,3

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
推理精度测试 - AI开发平台ModelArts

905-xxx.zip代码包已包含数据集。精度测试使用的是openai接口，部署服务的时候请使用openai-api启动，暂不支持vllm-api接口。获取精度测试代码。精度测试代码存放在代码包AscendCloud-3rdLLM的/llm_evaluation目录中，代码目录结构如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
ECS中构建新镜像 - AI开发平台ModelArts

Standard训练镜像获取模型软件包，并上传到ECS的目录下（可自定义路径），获取地址参考表1。解压AscendCloud压缩包及该目录下的训练代码AscendCloud-LLM-6.3.907-xxx.zip，并直接进入到llm_train/AscendSpeed文件夹下面 unzip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
预训练数据处理 - AI开发平台ModelArts

x-Ascend/llm_train/AscendSpeed/ModelLink/”目录，在代码目录中执行preprocess_data.py脚本处理数据。此处提供一段实际的数据处理代码示例如下。 #加载ascendspeed及megatron模型，xxx-Ascend请根据实际目录替换

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
在ModelArts上训练模型，输入输出数据如何配置？ - AI开发平台ModelArts

据输出所需的路径。在使用预置框架创建算法时，根据1中的代码参数设置定义的输入输出参数。训练数据是算法开发中必不可少的输入。“输入”参数建议设置为“data_url”，表示数据输入来源，也支持用户根据1的算法代码自定义代码参数。模型训练结束后，训练模型以及相关输出信息需保存在

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 训练过程读取数据
创建开发环境实例 - AI开发平台ModelArts

创建开发环境实例功能介绍创建开发环境实例，用于代码开发。该接口为异步操作，创建开发环境实例的状态请通过查询开发环境实例详情接口获取。 URI POST /v1/{project_id}/demanager/instances 参数说明如表1所示。表1 参数说明参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

增加了和OBS交互工作的整个训练流程如下：建议使用OBSutil作为和OBS交互的工具，如何在本机安装obsutil可以参考安装和配置OBS命令行工具。训练数据、代码、模型下载。（本地使用硬盘挂载或者docker cp，在ModelArts上使用OBSutil）启动脚本，用法无切换，一般就是到达执行目录，然后python

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard专属资源池训练模型
常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

以在启动脚本最前面加上如下代码，来关闭core文件产生。并推荐先在开发环境中进行代码调试。 import os os.system("ulimit -c 0") 建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障

总条数： 1081

上一页
1
...
30
31
32
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

无法导入模块 - AI开发平台ModelArts

日志提示“No space left on device” - AI开发平台ModelArts

run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

如何删除预置镜像中不需要的工具 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

Notebook使用场景 - AI开发平台ModelArts

给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

服务管理概述 - AI开发平台ModelArts

训练作业找不到GPU - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

在ModelArts上训练模型，输入输出数据如何配置？ - AI开发平台ModelArts

创建开发环境实例 - AI开发平台ModelArts

在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线