搜索_华为云

训练的数据集预处理说明 - AI开发平台ModelArts

tokenized_full_prompt 本案例中 alpaca_gpt4_data.json 数据集包含有以下字段： instruction：描述模型应执行的任务。指令中的每一条都是唯一的。 input：任务的可选上下文或输入。instruction 对应的内容会与 input 对应的内容拼接后作为指令，即指令为

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 训练脚本说明
创建自动模型优化的训练作业 - AI开发平台ModelArts

支持用户使用超参搜索功能。在0代码修改的基础下，实现算法模型的超参搜索。需要完成以下步骤：准备工作创建算法创建训练作业查看超参搜索作业详情准备工作数据已完成准备：已在ModelArts中创建可用的数据集，或者您已将用于训练的数据集上传至OBS目录。请准备好训练脚本

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 自动模型优化（AutoSearch）
基于AIGC模型的GPU推理业务迁移至昇腾指导 - AI开发平台ModelArts

基于AIGC模型的GPU推理业务迁移至昇腾指导场景介绍迁移环境准备 pipeline应用准备应用迁移迁移效果校验模型精度调优性能调优常见问题父主题： GPU业务迁移至昇腾训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

日志提示Compile graph failed 日志提示Custom op has no reg_op_name attr 父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
通过智能标注方式标注数据 - AI开发平台ModelArts

通过智能标注方式标注数据创建智能标注作业确认智能标注作业的数据难例使用自动分组智能标注作业父主题：标注ModelArts数据集中的数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
数据处理场景介绍 - AI开发平台ModelArts

数据处理场景介绍 ModelArts平台提供的数据处理功能，基本目的是从大量的、杂乱无章的、难以理解的数据中抽取或者生成对某些特定的人们来说是有价值、有意义的数据。当数据采集和接入之后，数据一般是不能直接满足训练要求的。为了保障数据质量，以免对后续操作（如数据标注、模型训练等）带

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
如何处理使用opencv.imshow造成的内核崩溃？ - AI开发平台ModelArts

如何处理使用opencv.imshow造成的内核崩溃？问题现象当在Notebook中使用opencv.imshow后，会造成Notebook崩溃。原因分析 opencv的cv2.imshow在jupyter这样的client/server环境下存在问题。而matplotlib不存在这个问题。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
如何提升训练效率，同时减少与OBS的交互？ - AI开发平台ModelArts

如何提升训练效率，同时减少与OBS的交互？场景描述在使用ModelArts进行自定义深度学习训练时，训练数据通常存储在对象存储服务（OBS）中，且训练数据较大时（如200GB以上），每次都需要使用GPU资源池进行训练，且训练效率低。希望提升训练效率，同时减少与对象存储OBS的交互。可通过如下方式进行调整优化。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 训练过程读取数据
AI引擎Scikit_Learn0.18.1的运行环境怎么设置？ - AI开发平台ModelArts

AI引擎Scikit_Learn0.18.1的运行环境怎么设置？在ModelArts的算法管理页面，创建算法时勾选“显示旧版镜像”，选择XGBoost-Sklearn引擎即可。 ModelArts创建算法操作请参见创建算法。 ModelArts创建训练作业操作请参见创建训练作业。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
训练作业的日志出现detect failed（昇腾预检失败） - AI开发平台ModelArts

原因分析出现该问题的可能原因如下：用户的自定义镜像中无ascend_check工具，导致启动预检失败。用户的自定义镜像中的ascend相关工具不可用，导致预检失败。处理方法通过给训练作业加环境变量“MA_DETECT_TRAIN_INJECT_CODE”并将对应的值设置成0，就

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > Ascend相关问题
迁移环境准备 - AI开发平台ModelArts

境安装，可以方便的替换驱动、固件和上层开发包，具有root权限，结合配置指导、初始化工具及容器镜像可以快速搭建昇腾开发环境。开通裸金属服务器资源请见DevServer资源开通，在裸金属服务器上搭建迁移环境请见裸金属服务器环境配置指导，使用ModelArts提供的基础容器镜像请见容器环境搭建。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
训练代码迁移 - AI开发平台ModelArts

训练代码迁移前提条件要迁移的训练任务代码在GPU上多次训练稳定可收敛。训练业务代码和数据，应该确保在GPU环境中能够运行，并且训练任务有稳定的收敛效果。本文只针对基于PyTorch的训练代码迁移。这里假设用户使用的是基于PyTorch的训练代码进行迁移。其他的AI引擎如Tensor

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
Notebook停止或者重启后，“/cache”下的文件还存在么？如何避免重启？ - AI开发平台ModelArts

Notebook停止或者重启后，“/cache”下的文件还存在么？如何避免重启？ “/cache”目录下存储的是临时文件，在Notebook实例停止或重启后，不会被保存。存储在“/home/ma-user/work”目录下的数据，在Notebook实例停止或重启后，会被保留。为

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 数据存储
在AI Gallery订阅的数据集可以在SDK中使用吗？ - AI开发平台ModelArts

数据集可以直接下载至OBS，也可以下载至ModelArts数据集中，不管任何方式，其最终的存储路径均为OBS目录。下载至OBS时，在下载任务完成后，数据将存储在下载时设置的OBS目录中。请注意下载任务中设置的区域，后续使用SDK或ModelArts控制台时，使用的区域需一致。下载至数据集时，可以在下载任务完成后，

帮助中心 > AI开发平台ModelArts > 常见问题 > AI Gallery
SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

AscendCloud-3rdAIGC-6.3.905-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E 如果没有软件下载权限，请联系您所在企业的华为方技术支持下载获取。基础镜像包 swr.cn-southwest-2.myhuaweicloud

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
SDXL基于DevServer适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

NPU的LoRA训练指导（6.3.905） Stable Diffusion（简称SD）是一种基于扩散过程的图像生成模型，应用于文生图场景，能够帮助用户生成图像。SDXL LoRA训练是指在已经训练好的SDXL模型基础上，使用新的数据集进行LoRA微调以优化模型性能的过程。本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
通过团队标注方式标注数据 - AI开发平台ModelArts

团队标注使用流程创建和管理团队创建团队标注任务审核并验收团队标注任务结果管理团队和团队成员父主题：标注ModelArts数据集中的数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
使用Notebook不同的资源规格，为什么训练速度差不多？ - AI开发平台ModelArts

使用Notebook不同的资源规格，为什么训练速度差不多？如果用户的代码中训练任务是单进程的，使用Notebook 8核64GB，72核512GB训练的速度是基本一致的，例如用户用的是2核4GB的资源，使用4核8GB，或者8核64GB效果是一样的。如果用户的代码中训练任务是多进程的，使用Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
精度对齐 - AI开发平台ModelArts
精度对齐 - AI开发平台ModelArts

script可以保证这块GPU和NPU dump的数据对齐。 compare表中Cosine列第一个出现偏差的位置，为einsum算子的输入。图8 Cosine列的偏差查看堆栈信息发现是self.inv_freq的值存在精度偏差，再追溯到self.inv_freq的定义片段。图9 inv_freq的定义片段通

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

"version": "1.0" } 转换功能的实现，可参考从0制作自定义镜像用于创建训练作业（MindSpore+Ascend）中所述的Ascend训练脚本的启动脚本。训练任务在容器中的挂载点说明使用自定义镜像训练模型时，训练任务在容器中的挂载点参考如表2所示。表2 训练任务挂载点介绍

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码

总条数： 2027

上一页
1
...
16
17
18
...
102
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练的数据集预处理说明 - AI开发平台ModelArts

创建自动模型优化的训练作业 - AI开发平台ModelArts

基于AIGC模型的GPU推理业务迁移至昇腾指导 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

通过智能标注方式标注数据 - AI开发平台ModelArts

数据处理场景介绍 - AI开发平台ModelArts

如何处理使用opencv.imshow造成的内核崩溃？ - AI开发平台ModelArts

如何提升训练效率，同时减少与OBS的交互？ - AI开发平台ModelArts

AI引擎Scikit_Learn0.18.1的运行环境怎么设置？ - AI开发平台ModelArts

训练作业的日志出现detect failed（昇腾预检失败） - AI开发平台ModelArts

迁移环境准备 - AI开发平台ModelArts

训练代码迁移 - AI开发平台ModelArts

Notebook停止或者重启后，“/cache”下的文件还存在么？如何避免重启？ - AI开发平台ModelArts

在AI Gallery订阅的数据集可以在SDK中使用吗？ - AI开发平台ModelArts

SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

SDXL基于DevServer适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

通过团队标注方式标注数据 - AI开发平台ModelArts

使用Notebook不同的资源规格，为什么训练速度差不多？ - AI开发平台ModelArts

精度对齐 - AI开发平台ModelArts

开发用于自定义镜像训练的代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线