搜索_华为云

ModelArts与DLS服务的区别？ - AI开发平台ModelArts

ModelArts与DLS服务的区别？深度学习服务（DLS）是基于华为云强大高性能计算提供的一站式深度学习平台服务，内置大量优化的网络模型，以便捷、高效的方式帮助用户轻松使用深度学习技术，通过灵活调度按需服务化方式提供模型训练与评估。但是，DLS服务仅提供深度学习技术，而ModelArts集成了深度学习和机器

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
删除训练作业 - AI开发平台ModelArts

会话对象，初始化方法请参考Session鉴权。 job_id 是 String 训练作业的id，可通过创建训练作业生成的训练作业对象查询，如"job_instance.job_id"，或从查询训练作业列表的响应中获得。无成功响应参数。表2 调用训练接口失败响应参数参数类型描述 error_msg

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
MindSpore样例 - 网络智能体
MindSpore样例 - 网络智能体

用户也可以通过模型训练服务超参配置，覆盖默认值。单击“创建”，弹出“创建训练”对话框。配置MindSpore样例训练工程参数，如图1所示。图1 创建MindSpore样例训练工程单击“确定”。进入模型训练工程详情界面，如图2所示。图2 模型训练工程详情界面单击界面

 帮助中心 > 网络智能体 > 模型训练服务 > 用户指南 > 模型训练 > 创建模型训练工程
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

预训练前提条件已上传训练代码、训练权重文件和数据集到OBS中，具体参考代码上传至OBS。 Step1 创建训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及选择上传的镜像。代码目录选择：OBS桶路径下的 llm_train/AscendSpeed

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

Step4 开启训练故障自动重启功能创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图2 开启故障重启断点续训练是通过checkpoi

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

Step4 开启训练故障自动重启功能创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图2 开启故障重启断点续训练是通过checkpoi

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
自动学习训练后的模型是否可以下载？ - AI开发平台ModelArts

自动学习训练后的模型是否可以下载？不可以下载。但是您可以在AI应用管理页面查看，或者将此模型部署为在线服务。父主题：模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
检查暂停的程序 - CodeArts IDE
检查暂停的程序 - CodeArts IDE

检查暂停的程序当您启动调试会话时，“运行和调试”视图将自动打开并显示与运行和调试相关的所有信息。要手动打开“运行和调试”视图，请单击CodeArts IDE底部面板中的“运行和调试”按钮（），或按 “Ctrl+Shift+D” / “Shift+Alt+F9”（IDEA快捷键）/

帮助中心 > CodeArts IDE > 用户指南 > Python > 调试
创建训练作业 - AI开发平台ModelArts

String 训练作业选择的引擎版本，请参考查询引擎规格列表。 user_image_url 否 String 自定义镜像训练作业的自定义镜像的SWR-URL。 user_command 否 String 自定义镜像训练作业的启动命令。 log_url 否 String 训练作业日志的

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图2 开启故障重启断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图2 开启故障重启断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图2 开启故障重启断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图2 开启故障重启断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
训练作业训练失败报错：TypeError: unhashable type: ‘list’ - AI开发平台ModelArts

训练作业训练失败报错：TypeError: unhashable type: ‘list’ 问题现象使用订阅算法图像分类-EfficientNetB4进行训练报错：TypeError: unhashable type: ‘list’。原因分析可能由于使用了多标签分类导致（即一个图片用了1个以上的标签）。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
训练模型 - 企业级AI应用开发专业套件 ModelArts Pro

“学习率”用来控制模型的学习速度，范围为(0,1]。 “训练轮次”指模型训练中遍历数据集的次数。确认信息后，单击“开始训练”。模型训练一般需要运行一段时间，等模型训练完成后，“模型训练”页面下方显示训练详情。查看训练详情模型训练完成后，可在“模型训练”页面查看“训练详情”，包括“准确率变化情况”和“误差变化”。

帮助中心 > 企业级AI应用开发专业套件 ModelArts Pro > 用户指南 > 自然语言处理套件 > 通用文本分类工作流
监视 - CodeArts IDE
监视 - CodeArts IDE

要删除表达式，请选择它，然后按Delete。要同时删除所有表达式，请单击Remove all Expressions按钮（）。父主题：检查暂停的程序

 帮助中心 > CodeArts IDE > 用户指南 > Java > 调试 > 检查暂停的程序
监视 - CodeArts IDE
监视 - CodeArts IDE

”。要删除一个表达式，只需选择它并按 “Delete” 键。若要一次性删除所有表达式，请单击“删除所有表达式”按钮（）。父主题：检查暂停的程序

 帮助中心 > CodeArts IDE > 用户指南 > Python > 调试 > 检查暂停的程序
训练作业的启动文件如何获取训练作业中的参数？ - AI开发平台ModelArts

训练作业的启动文件如何获取训练作业中的参数？训练作业参数有两种来源，包括后台自动生成的参数和用户手动输入的参数。具体获取方式如下：创建训练作业时，“输入”支持配置训练的输入参数名称（一般设置为“data_url”），以及输入数据的存储位置，“输出”支持配置训练的输出参数名称（

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 编写训练代码
LoRA训练 - AI开发平台ModelArts
LoRA训练 - AI开发平台ModelArts

LoRA训练本章节介绍SDXL&SD 1.5模型的LoRA训练过程。LoRA训练是指在已经训练好的模型基础上，使用新的数据集进行LoRA微调以优化模型性能的过程。训练前需要修改数据集路径、模型路径。脚本里写到datasets路径即可。 run_lora_sdxl中的vae路径要准确写到sdxl_vae

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
LoRA训练 - AI开发平台ModelArts
LoRA训练 - AI开发平台ModelArts

LoRA训练本章节介绍SDXL&SD 1.5模型的LoRA训练过程。LoRA训练是指在已经训练好的模型基础上，使用新的数据集进行LoRA微调以优化模型性能的过程。启动SD1.5 LoRA训练服务使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_lora_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）

总条数： 7757

上一页
1
...
5
6
7
...
388
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts与DLS服务的区别？ - AI开发平台ModelArts

删除训练作业 - AI开发平台ModelArts

MindSpore样例 - 网络智能体

预训练 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

自动学习训练后的模型是否可以下载？ - AI开发平台ModelArts

检查暂停的程序 - CodeArts IDE

创建训练作业 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

训练作业训练失败报错：TypeError: unhashable type: ‘list’ - AI开发平台ModelArts

训练模型 - 企业级AI应用开发专业套件 ModelArts Pro

监视 - CodeArts IDE

监视 - CodeArts IDE

训练作业的启动文件如何获取训练作业中的参数？ - AI开发平台ModelArts

LoRA训练 - AI开发平台ModelArts

LoRA训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线