搜索_华为云

运行第一条Workflow - AI开发平台ModelArts

版本可以不用选择。 task_name：填写需要创建的标注任务名称即可。说明：首次运行需要配置，会自动创建新的标注任务，后续不建议进行修改，使用同一个标注任务进行数据标注。图像分类训练参数配置算法超参相关的配置，建议直接使用默认值。每个参数的具体含义已在控制台界面输入框下方说明。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
责任共担 - AI开发平台ModelArts
责任共担 - AI开发平台ModelArts

华为云租户的安全责任在于对使用的IaaS、PaaS和SaaS类各项云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
分布式训练功能介绍 - AI开发平台ModelArts

本文档提供的调测代码是以PyTorch为例编写的，不同的AI框架之间，整体流程是完全相同的，只需要修改个别的参数即可。 DataParallel进行单机多卡训练的优缺点代码简单：仅需修改一行代码。通信瓶颈：负责reducer的GPU更新模型参数后分发到不同的GPU，因此有较大的通信开销。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

下步骤排查。解决方案排查/home/ma-user权限，建议将该目录权限设置为755或750，权限不能过于宽松，以保证用户隔离和安全。修改方法如下。 chomd 755 /home/ma-user chomd 750 /home/ma-user 排查密钥是否是和实例绑定的一致。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
训练脚本参数说明 - AI开发平台ModelArts

安装模型运行环境 └── qwen-vl.patch # 使用git apply修改模型相关代码父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
管理和查看数据处理任务 - AI开发平台ModelArts

处理”，进入“数据处理”页面。在数据处理列表中，单击数据处理任务名称，进入数据处理任务的版本管理页面。您可以在该页面进行数据处理任务的“修改”与“删除”。图1 数据处理版本管理页面您可以在版本管理页面，通过切换页签查看“配置信息”、“日志”和“结果展示”。图2 日志页面图3

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

单击资源池名称，进入资源池详情。单击左侧“AI组件管理 > AI诊断”。单击“诊断”，选择“日志上传路径”和NCCL Test节点，其余参数可保持默认值或根据实际需求修改。测试使用的最大数据：取值范围[1, 1024]，单位可选为“B”、“KB”、“MB”、“GB”“TB”。测试使用的最大数据须大于开始测试使用的最小数据。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Cluster
训练脚本存放目录说明 - AI开发平台ModelArts

安装模型运行环境 └── qwen-vl.patch # 使用git apply修改模型相关代码父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
从Manifest文件导入规范说明 - AI开发平台ModelArts

11:30:30" }, { "type":"modelarts/text_triplet", "name":"Author", "id":"R1",

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
管理AI Gallery数据集 - AI开发平台ModelArts

一起同步至运行平台。数据集描述 - 资产的README内容，支持添加资产的简介、使用场景、使用方法等信息。编辑完成后，单击“确认”保存修改。管理数据集文件预览文件在数据集详情页，选择“数据集文件”页签。单击文件名称即可在线预览文件内容。仅支持预览大小不超过10MB、格式为文本类或图片类的文件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
创建ModelArts数据校验任务 - AI开发平台ModelArts

"modelarts/image_classification" } ] } 数据输出的data文件夹中存放的是修改、更新过的图片，对于数据处理过程中没有修改过的图片，在data文件夹中不会展示，图片的位置信息显示该图片在输入目录中。 output.manifest存放的是数

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
训练作业进程被kill - AI开发平台ModelArts

在notebook调试用户代码，并找出问题的代码段。通过关键代码段 + 退出码尝试去搜索引擎寻找解决办法。，通过训练日志排查问题通过日志判断出问题的代码范围。修改代码，在问题代码段添加打印，输出更详细的日志信息。再次运行作业，判断出问题的代码段。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
用户使用ma-cli制作自定义镜像失败，报错文件不存在（not found） - AI开发平台ModelArts

ma/customize_from_ubuntu_18.04_to_modelarts”下。图3 查询Dockerfile的路径 Dockerfile命令修改为相对路径，举例如下： COPY ./mindspore-2.1.0-cp39-cp39-linux_aarch64.whl /tmp/mindspore-2

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
创建和管理团队 - AI开发平台ModelArts

述”，单击左下角“添加账号ID”。填写完成之后，然后单击“确定”。邮箱作为团队管理中的唯一标识，不同成员不能使用同一个邮箱。您填写的邮箱地址将被记录并保存在ModelArts中，仅用于ModelArts团队标注功能，当成员删除后，其填写的邮箱信息也将被一并删除。其中，“角色”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
moxing.tensorflow是否包含整个TensorFlow，如何对生成的checkpoint进行本地Fine Tune？ - AI开发平台ModelArts

tensorflow包含所有的接口，对TensorFlow做了优化，里面的实际接口还是TensorFlow的原生接口。当非MoXing代码中没有Adam名称范围时，需要修改非MoXing代码，在其中增加如下内容： with tf.variable_scope("Adam"): 在增加代码时不建议使用自定义“global_step”，推荐使用tf

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
训练作业进程异常退出 - AI开发平台ModelArts

在notebook调试用户代码，并找出问题的代码段。通过关键代码段 + 退出码尝试去搜索引擎寻找解决办法。，通过训练日志排查问题通过日志判断出问题的代码范围。修改代码，在问题代码段添加打印，输出更详细的日志信息。再次运行作业，判断出问题的代码段。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
更新训练作业描述 - AI开发平台ModelArts

调用失败时的错误信息。调用成功时无此字段。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。请求示例如下以修改“job_id”为10的作业描述为例。 PUT https://endpoint/v1/{project_id}/training-jobs/10

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
创建训练任务 - AI开发平台ModelArts

-b 128 --epochs 5 dog_cat_1w/ 此处的“demo”为用户自定义的OBS存放代码路径的最后一级目录，可以根据实际修改。资源池：在“专属资源池”页签选择GPU规格的专属资源池。规格：选择单GPU规格。单击“提交”，在“信息确认”页面，确认训练作业的参数信息，确认无误后单击“确定”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

用户选择了1/2/4卡这些规格的作业，然后设置了CUDA_VISIBLE_DEVICES=‘1’这种类似固定的卡ID号，与实际选择的卡ID不匹配。处理方法尽量代码里不要去修改CUDA_VISIBLE_DEVICES变量，用系统默认里面自带的。如果必须指定卡ID，需要注意1/2/4规格下，指定的卡ID与实际分配的卡ID不匹配的情况。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
功能总览 - AI开发平台ModelArts
功能总览 - AI开发平台ModelArts

的算力规格，开发者可以一键进入开发环境，直接免费体验Notebook功能。另外，针对AI Gallery社区发布的Notebook样例（.ipynb格式文件），可直接在CodeLab中打开，查看他人分享的样例代码。 CodeLab简介 AI Gallery上的Notebook样例

 帮助中心 > AI开发平台ModelArts > 功能总览

总条数： 1459

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

运行第一条Workflow - AI开发平台ModelArts

责任共担 - AI开发平台ModelArts

分布式训练功能介绍 - AI开发平台ModelArts

报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

训练脚本参数说明 - AI开发平台ModelArts

管理和查看数据处理任务 - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

训练脚本存放目录说明 - AI开发平台ModelArts

从Manifest文件导入规范说明 - AI开发平台ModelArts

管理AI Gallery数据集 - AI开发平台ModelArts

创建ModelArts数据校验任务 - AI开发平台ModelArts

训练作业进程被kill - AI开发平台ModelArts

用户使用ma-cli制作自定义镜像失败，报错文件不存在（not found） - AI开发平台ModelArts

创建和管理团队 - AI开发平台ModelArts

moxing.tensorflow是否包含整个TensorFlow，如何对生成的checkpoint进行本地Fine Tune？ - AI开发平台ModelArts

训练作业进程异常退出 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

功能总览 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线