搜索_华为云

安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

-> 'c:\python39\Scripts\ephemeral-port-reserve.exe.deleteme ”。原因分析用户使用权限问题导致。处理方法用户电脑切换到管理员角色，键盘快捷键（Windows+R模式）并输入cmd，进入黑色窗口，执行如下命令： python

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
查询开发环境实例详情 - AI开发平台ModelArts

排队信息，如表17所示。 user Object 用户信息，如表18所示。 repository Object Git仓库信息，如表19所示。该字段不支持使用，在调用接口时会自动返回。表3 profile字段数据结构说明参数参数类型说明 id String 配置ID。 name String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
如何通过docker镜像启动容器？ - AI开发平台ModelArts

run启动通过Notebook保存的镜像，报错创建容器任务失败，启动文件或目录不存在，如图2。因此需要设置--entrypoint参数，覆盖Entrypoint中指定的程序。使用--entrypoint参数指定的启动文件或命令启动镜像。命令示例如下： docker run -it -d --entrypoint /bin/bash

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
按标签名称更新单个标签 - AI开发平台ModelArts

@modelarts:from_type 否 String 内置属性：三元组关系标签的起始实体类型，创建关系标签时必须指定，该参数仅文本三元组数据集使用。 @modelarts:rename_to 否 String 内置属性：重命名后的标签名。 @modelarts:shortcut 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
更新节点池 - AI开发平台ModelArts

资源规格名称，比如：modelarts.vm.gpu.t4u8。 count 是 Integer 规格保障使用量。 maxCount 是 Integer 资源规格的弹性使用量，物理池该值和count相同。 azs 否 Array of PoolNodeAz objects 资源池中节点的AZ信息。

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
审核并验收团队标注任务结果 - AI开发平台ModelArts

只有数据集创建者可修改。表1 完成验收的参数设置参数说明对已标注数据修改不覆盖：针对同一个数据，不使用当前团队标注的结果覆盖已有数据。覆盖：针对同一个数据，使用当前团队标注的结果覆盖已有数据。覆盖后无法恢复，请谨慎操作。验收范围全部通过：被驳回的样本，也会通过。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
执行LoRA微调训练任务 - AI开发平台ModelArts

NODE_RANK=0 sh scripts/llama2/0_pl_lora_13b.sh 如果单机运行需要指定使用NPU卡的数量，可提前定义变量 NPUS_PER_NODE 。例如使用单机四卡训练Llama2-7B命令。 MASTER_ADDR=localhost NNODES=1 NODE_RANK=0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909）
执行LoRA微调训练任务 - AI开发平台ModelArts

NODE_RANK=0 sh scripts/llama2/0_pl_lora_13b.sh 如果单机运行需要指定使用NPU卡的数量，可提前定义变量 NPUS_PER_NODE 。例如使用单机四卡训练Llama2-7B命令。 MASTER_ADDR=localhost NNODES=1 NODE_RANK=0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911）
查询训练作业版本列表 - AI开发平台ModelArts

dataset_version String 训练作业的数据集版本ID。 type String 数据集类型。 “obs”：表示使用OBS的数据。 “dataset”：表示使用数据集的数据。 data_url String OBS的桶路径。表7 model_metric_list属性列表参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

单击“创建训练作业”，进入创建训练作业页面，填写作业信息，创建方式参考表1，其他参数填写请参考创建训练作业。表1 创建训练作业的创建方式（使用自定义镜像）参数名称说明创建方式必选，选择“自定义算法”。启动方式必选，选择“自定义”。镜像必填，单击右边的“选择”，从容器镜像中选择上一步上传到SWR的镜像。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
执行LoRA微调训练任务 - AI开发平台ModelArts

NODE_RANK=0 sh scripts/llama2/0_pl_lora_13b.sh 如果单机运行需要指定使用NPU卡的数量，可提前定义变量 NPUS_PER_NODE 。例如使用单机四卡训练Llama2-7B命令。 MASTER_ADDR=localhost NNODES=1 NODE_RANK=0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908）
执行LoRA微调训练任务 - AI开发平台ModelArts

NODE_RANK=0 sh scripts/llama2/0_pl_lora_13b.sh 如果单机运行需要指定使用NPU卡的数量，可提前定义变量 NPUS_PER_NODE 。例如使用单机四卡训练Llama2-7B命令。 MASTER_ADDR=localhost NNODES=1 NODE_RANK=0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910）
训练脚本参数说明 - AI开发平台ModelArts

# 安装模型运行环境 └── qwen-vl.patch # 使用git apply修改模型相关代码父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
训练脚本存放目录说明 - AI开发平台ModelArts

# 安装模型运行环境 └── qwen-vl.patch # 使用git apply修改模型相关代码父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
训练性能测试 - AI开发平台ModelArts

yaml相对或绝对路径，此配置文件为训练最优配置参数。 --baseline <baseline>：<可选>GP-Ant8机器性能基线yaml文件路径，用户可自行修改，不填则使用工具自带基线配置，默认基线配置样例如下： --o <output_dir>： <可选>任务完成输出excel表格路径，默认为"./"当前所在路径。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练benchmark工具
ModelArts训练作业无法解析参数，日志报错 - AI开发平台ModelArts

add_argument('--init_method', default='tcp://xxx',help="init-method") 通过使用解析方式args, unparsed = parser.parse_known_args()代替args = parser.parse_args()解决该问题。代码示例如下：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
镜像保存时报错“The container size (xG) is greater than the threshold (25G)”如何解决？ - AI开发平台ModelArts

像超大会导致加载的各种问题，所以这里做了限制。这种场景下，建议找到原始镜像重新构建环境进行保存。解决方法找到原始镜像重新构建环境。建议使用干净的基础镜像，最小化的安装运行依赖内容，并进行安装后的软件缓存清理，然后保存镜像。父主题：自定义镜像故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
Tensorflow多节点作业下载数据到/cache显示No space left - AI开发平台ModelArts

he”，实际下载的数据会翻倍。例如只下载了2.5TB的数据，程序就显示空间不够而失败，因为/cache只有4TB的可用空间。处理方法在使用Tensorflow多节点作业下载数据时，正确的下载逻辑如下： import argparse parser = argparse.ArgumentParser()

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
在ModelArts的Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

请参见《OBS权限配置指南》> 典型场景配置案例，查找授予OBS桶权限的指导。获得OBS桶的读写权限后，您可以在Notebook中，使用moxing接口，访问对应的OBS桶，并读取数据。举例如下： import moxing as mox mox.file.copy_par

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
ModelArts环境挂载目录说明 - AI开发平台ModelArts

rnetes.io/serviceaccount 是 / 训练任务表2 训练任务挂载点介绍挂载点是否只读备注 /xxx 否专属池使用SFS盘挂载的目录，路径由客户自己指定。 /home/ma-user/modelarts 否空文件夹，建议用户主要用这个目录。 /cache

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ

总条数： 2181

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

查询开发环境实例详情 - AI开发平台ModelArts

如何通过docker镜像启动容器？ - AI开发平台ModelArts

按标签名称更新单个标签 - AI开发平台ModelArts

更新节点池 - AI开发平台ModelArts

审核并验收团队标注任务结果 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

查询训练作业版本列表 - AI开发平台ModelArts

已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

训练脚本参数说明 - AI开发平台ModelArts

训练脚本存放目录说明 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

ModelArts训练作业无法解析参数，日志报错 - AI开发平台ModelArts

镜像保存时报错“The container size (xG) is greater than the threshold (25G)”如何解决？ - AI开发平台ModelArts

Tensorflow多节点作业下载数据到/cache显示No space left - AI开发平台ModelArts

在ModelArts的Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

ModelArts环境挂载目录说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线