搜索_华为云

管理AI Gallery中的AI应用 - AI开发平台ModelArts

查看环境变量的值：单击，可以查看当前环境变量的值。新增环境变量：单击“新增”，在编辑环境变量弹窗中配置“变量名称”和“变量值”，单击“确定”完成配置。修改环境变量：单击，在编辑环境变量弹窗中修改“变量名称”或“变量值”，单击“确定”完成配置。删除环境变量：单击，确认永久删除环境变量，单击“确定”完成删除。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

e的编译任务，从而能够在推理时支持多种shape的输入。动态batch 在模型转换阶段通过--configFile参数指定配置文件，并且在配置文件中配置input_shape及dynamic_dims动态参数。其中input_shape的-1表示动态shape所在的维度，dyn

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
修改训练作业优先级 - AI开发平台ModelArts

中”的训练作业，单击“作业优先级”列的，在弹窗中修改优先级后单击“确定”。图1 修改作业优先级给子账号配置"设置作业为高优先级"权限默认用户权限可选择优先级1和2，配置了"设置作业为高优先级"权限的用户可选择优先级1~3。使用主用户账号登录华为云的管理控制台，单击右上角用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
创建训练任务 - AI开发平台ModelArts

创建训练任务登录ModelArts管理控制台，检查当前账号是否已完成访问授权的配置。如果未完成，请参考使用委托授权针对之前使用访问密钥授权的用户，建议清空授权，然后使用委托进行授权。在左侧导航栏中选择“模型训练 > 训练作业”，默认进入“训练作业”列表。单击“创建训练作业”进入创建训练作业页面。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
增量模型训练 - AI开发平台ModelArts

增量模型训练什么是增量训练增量训练（Incremental Learning）是机器学习领域中的一种训练方法，它允许人工智能（AI）模型在已经学习了一定知识的基础上，增加新的训练数据到当前训练流程中，扩展当前模型的知识和能力，而不需要从头开始。增量训练不需要一次性存储所有的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
批量更新样本标签 - AI开发平台ModelArts

操作失败的错误信息。 results Array of BatchResponse objects 批量更新样本标签的响应结果列表。 success Boolean 操作是否执行成功。可选值如下： true：执行成功 false：执行失败表8 BatchResponse 参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
批量更新团队标注样本的标签 - AI开发平台ModelArts

操作失败的错误信息。 results Array of BatchResponse objects 批量更新样本标签的响应结果列表。 success Boolean 操作是否执行成功。可选值如下： true：执行成功 false：执行失败表8 BatchResponse 参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
附录：训练常见问题 - AI开发平台ModelArts

e调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Deepspeed-ZeRO-1替换为Deepspeed-ZeRO-2以此类推，重新训练如未解决则执行下一步。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
云上迁移适配故障 - AI开发平台ModelArts

云上迁移适配故障无法导入模块训练作业日志中提示“No module named .*” 如何安装第三方包，安装报错的处理方法下载代码目录失败训练作业日志中提示“No such file or directory” 训练过程中无法找到so文件 ModelArts训练作业无法解析参数，日志报错

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
报错“Host key verification failed.'或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

User：用户名，例如：ma-user - HostName：IP地址 - Port：端口号在VS Code中手工配置远程连接时，在本地的ssh config文件中增加配置参数“StrictHostKeyChecking no”和“UserKnownHostsFile=/dev/null”

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

连接时如果报错密钥无权限，排查密钥是否为自己的密钥（可能使用了重名密钥），请更换密钥后重新连接实例。本地排查检查配置是否正确。打开config文件进行检查：Host必须放在每组配置的第一行，作为每组配置的唯一ID。 HOST remote-dev hostname <instance connection

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
SFT全参微调训练 - AI开发平台ModelArts

最后，请参考查看日志和性能章节查看LoRA微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。 Step2 配置环境变量单击“增加环境变量”，在增加的环境变量填写框中，按照表1表格中的配置进行填写。表1 需要填写的环境变量环境变量示例值参数说明 GPUS_PER_NODE 8 必

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
如何将在ModelArts中训练好的模型下载或迁移到其他账号？ - AI开发平台ModelArts

您可以通过如下两种方式将训练的模型迁移到其他账号。将训练好的模型下载至本地后，上传至目标账号对应区域的OBS桶中。通过对模型存储的目标文件夹或者目标桶配置策略，授权其他账号进行读写操作。详请参见配置高级桶策略。父主题： Standard模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
msprobe梯度监控 - AI开发平台ModelArts

练过程中精度问题出现的Step，以及抓取反向过程中的问题。使用步骤如下：通过pip安装msprobe工具。 # shell pip install mindstudio-probe 创建配置文件config.json。 { "task": "grad_probe", "dump_path":

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
查询训练作业列表 - AI开发平台ModelArts

n_id+item_version_id则无需填写。 autosearch_config_path String 自动化搜索作业的yaml配置路径，需要提供一个OBS路径。 autosearch_framework_path String 自动化搜索作业的框架代码目录，需要提供一个OBS路径。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

图1 netron中查看inputShape 精度选择。精度选择需要在模型转换阶段进行配置，执行converter_lite命令时通过--configFile参数指定配置文件路径，配置文件通过precision_mode参数指定精度模式。可选的参数有“enforce_fp32

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
训练作业日志中提示 “AttributeError: module '***' has no attribute '***'” - AI开发平台ModelArts

者方法第三方pip源中的python包版本更新，导致在训练作业中安装的python包的版本可能也会发生变化。如训练作业之前无此问题，后面一直有此问题，则考虑是此原因。处理方法通过Notebook调试。安装时指定版本。如：pip install xxx==1.x.x 第三方

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
msprobe精度比对 - AI开发平台ModelArts

re_log配置是否开启日志打屏。多卡场景区别于单卡场景会在步骤2按rank标号信息生成多个rank的dump文件结果，npu_path指定NPU环境生成包含多rank目录，gpu_path指定标杆环境包含多rank目录，is_print_compare_log配置是否开启日志打屏。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
模型训练使用流程 - AI开发平台ModelArts

模型训练前，一般会先对代码进行调试，ModelArts提供多种方式创建调试训练作业。 ModelArts提供了云化版本的JupyterLab，无需关注安装配置，即开即用。 ModelArts也提供了本地IDE的方式开发模型，通过开启SSH远程开发，本地IDE可以远程连接到调试训练作业中，进行调

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
在ModelArts的Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

写权限。此操作指导是某一华为云账号将其OBS桶权限授予其他华为云账号。如果您的账号是IAM用户或其他场景时，请参见《OBS权限配置指南》> 典型场景配置案例，查找授予OBS桶权限的指导。获得OBS桶的读写权限后，您可以在Notebook中，使用moxing接口，访问对应的OBS桶，并读取数据。举例如下：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook

总条数： 1838

上一页
1
...
78
79
80
...
92
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理AI Gallery中的AI应用 - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

修改训练作业优先级 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

增量模型训练 - AI开发平台ModelArts

批量更新样本标签 - AI开发平台ModelArts

批量更新团队标注样本的标签 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

云上迁移适配故障 - AI开发平台ModelArts

报错“Host key verification failed.'或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

如何将在ModelArts中训练好的模型下载或迁移到其他账号？ - AI开发平台ModelArts

msprobe梯度监控 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

训练作业日志中提示 “AttributeError: module '' has no attribute ''” - AI开发平台ModelArts

msprobe精度比对 - AI开发平台ModelArts

模型训练使用流程 - AI开发平台ModelArts

在ModelArts的Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线