搜索_华为云

保存ckpt时超时报错 - AI开发平台ModelArts

分钟时，会发生超时的错误。图1 报错提示解决方法 1. 需要保证磁盘IO带宽正常，可以在36分钟内将文件保存到磁盘。单个节点内，最大只有60G（实际应该在40G以下）的文件内容，只要在36分钟内保存完成，就不会报超时错误。 2. 忽略该报错，因为报错不影响实际报错的权重。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 常见错误原因和解决方法
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

ape模型。静态shape模型文件导出方法请参考模型准备。图1 netron中查看inputShape 精度选择。精度选择需要在模型转换阶段进行配置，执行converter_lite命令时通过--configFile参数指定配置文件路径，配置文件通过precision_mod

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

择“模型文件”页签可以查看微调产物。各文件说明请参见表3。图1 微调产物示例表3 微调产物说明文件名文件说明 gallery_train文件夹自定义模型的模型训练文件，仅当使用自定义模型微调时才会有这个微调产物，内容和预训练模型里的gallery_train文件一致。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
报错“Permissions for 'x:/xxx.pem' are too open”如何解决？ - AI开发平台ModelArts

open”如何解决？问题现象原因分析原因分析一：密钥文件未放在指定路径，详情请参考安全限制或VS Code文档。请参考解决方法一处理。原因分析二：当操作系统为macOS/Linux时，可能是密钥文件或放置密钥的文件夹权限问题，请参考解决方法二处理。解决方法解决方法一：

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
附录：指令微调训练常见问题 - AI开发平台ModelArts

附录：指令微调训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考各个模型深度学习训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907）
管理AI Gallery中的AI应用 - AI开发平台ModelArts

当AI应用的“可见范围”是“私密”时，才支持修改环境变量、可见范围或删除AI应用。管理AI应用环境变量 AI应用支持增删改查环境变量，配置好的环境变量可以在运行文件中直接调用。在AI应用详情页，选择“设置”页签。在“环境变量管理”处，可以查看、新增、修改、删除环境变量。最多支持创建100个环境变

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
管理AI Gallery数据集 - AI开发平台ModelArts

管理数据集文件预览文件在数据集详情页，选择“数据集文件”页签。单击文件名称即可在线预览文件内容。仅支持预览大小不超过10MB、格式为文本类或图片类的文件。下载文件在数据集详情页，选择“数据集文件”页签。单击操作列的“下载”，选择保存路径单击“确认”，即可下载文件到本地。删除文件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
Manifest管理概述 - AI开发平台ModelArts

fest文件。 Manifest文件中定义了标注对象和标注内容的对应关系。Manifest文件中也可以只有原始文件信息，没有标注信息，如生成的未标注的数据集。 Manifest文件使用UTF-8编码，Manifest处理程序需具备UTF-8处理能力。 Manifest文件中文本分

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

专属资源池的容器引擎空间的默认为50G，支持在创建专属资源池时自定义容器引擎空间。确定错误类型提示找不到文件等错误，请参见训练作业日志中提示“No such file or directory”。提示找不到包等错误，请参见训练作业日志中提示“No module named

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic？ - AI开发平台ModelArts

reboot 第一条命令为安装Linux内核头文件和内核镜像，其中版本为5.4.0-144-generic。第二条命令为重新生成GRUB引导程序的配置文件，用于在启动计算机时加载操作系统，命令将使用新安装的内核镜像更新GRUB的配置文件，以便在下次启动时加载新的内核。父主题： Lite

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

${work_dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统，work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_dir为要挂载到的容器中的目录。为方便两个地址可以相同。 shm-size：共享内存大小。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
在Notebook上安装配置Grafana - AI开发平台ModelArts

f/grafana-9.1.6/conf/defaults.ini”文件。修改[server]中的“root_url”和“serve_from_sub_path”字段。图1 修改defaults.ini文件其中： root_url的组成为：https:{jupyterlab

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
断点续训和故障快恢说明 - AI开发平台ModelArts

kpoints中最大迭代次数（iter_000xxxx）Megatron格式权重文件。 lora微调不支持断点续训启动前需检查latest_checkpointed_iteration.txt文件中内容是否与所需iter_000xxxx数字（表示训练后保存权重对应迭代次数）保持

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
训练启动脚本说明和参数配置【旧】 - AI开发平台ModelArts

CKPT、PLOG、LOG 文件。如果用户需要修改，可添加并自定义该变量。 ASCEND_PROCESS_LOG_PATH /home/ma-user/work/AscendFactory/saved_dir_for_output/plog 保存训练过程中记录的程序堆栈信息日志 PLOG 文件。示例中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
保存ckpt时超时报错 - AI开发平台ModelArts

分钟时，会发生超时的错误。图1 报错提示解决方法 1. 需要保证磁盘IO带宽正常，可以在36分钟内将文件保存到磁盘。单个节点内，最大只有60G（实际应该在40G以下）的文件内容，只要在36分钟内保存完成，就不会报超时错误。 2. 忽略该报错，因为报错不影响实际报错的权重。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
发布Workflow到ModelArts - AI开发平台ModelArts

wf.AlgorithmParameters(name="save_model_secs", value=wf.Placeholder(name="save_model_secs", placeholder_type=wf.PlaceholderType.INT, default=60

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

pe的编译任务，从而能够在推理时支持多种shape的输入。动态batch 在模型转换阶段通过--configFile参数指定配置文件，并且在配置文件中配置input_shape及dynamic_dims动态参数。其中input_shape的-1表示动态shape所在的维度，dy

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
使用CodeLab免费体验Notebook - AI开发平台ModelArts

常用操作指导可参见JupyterLab操作指导：JupyterLab常用功能介绍。由于CodeLab的存储为系统默认路径，在使用“上传文件”或“下载文件至本地”时，只能使用JupyterLab页面提供的功能。如需使用大文件上传和下载的功能，建议您前往Notebook，创建一个收费的实例进行使用。切换规格。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
使用ChatGLM3-6B或GLM-4-9B模型微调后，权重校验失败 - AI开发平台ModelArts

inconsistent with standard open source 原因分析 ChatGLM3-6B或GLM-4-9B调优转换后的模型文件中配置文件与原始文件有差异，导致权重校验失败。问题影响 ChatGLM3-6B或GLM-4-9B调优转换后的模型无法使用权重校验。处理方法 Ch

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
执行训练任务（历史版本） - AI开发平台ModelArts

执行训练任务（历史版本）步骤一上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练任务

总条数： 1654

上一页
1
...
42
43
44
...
83
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

保存ckpt时超时报错 - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

报错“Permissions for 'x:/xxx.pem' are too open”如何解决？ - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

管理AI Gallery中的AI应用 - AI开发平台ModelArts

管理AI Gallery数据集 - AI开发平台ModelArts

Manifest管理概述 - AI开发平台ModelArts

自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic？ - AI开发平台ModelArts

LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

在Notebook上安装配置Grafana - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

训练启动脚本说明和参数配置【旧】 - AI开发平台ModelArts

保存ckpt时超时报错 - AI开发平台ModelArts

发布Workflow到ModelArts - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

使用CodeLab免费体验Notebook - AI开发平台ModelArts

使用ChatGLM3-6B或GLM-4-9B模型微调后，权重校验失败 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线