搜索_华为云

训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练的数据集预处理说明训练的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911）
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练的数据集预处理说明训练的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910）
查找Notebook实例 - AI开发平台ModelArts

查找Notebook实例查找实例 Notebook页面展示了所有创建的实例。如果需要查找特定的实例，可根据筛选条件快速查找。参考给子账号配置查看所有Notebook实例的权限后，进入“开发空间>Notebook”页面，打开“查看所有”开关，可以看到IAM项目下所有子账号创建的Notebook实例。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
推理精度测试 - AI开发平台ModelArts

推理精度测试本章节介绍如何使用lm-eval工具开展语言模型的推理精度测试，数据集包含mmlu、ARC_Challenge、GSM_8k、Hellaswag、Winogrande、TruthfulQA等。约束限制确保容器可以访问公网。当前的精度测试仅适用于语言模型精度验证

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
使用Notebook进行AI开发调试 - AI开发平台ModelArts

使用Notebook进行AI开发调试 Notebook使用场景创建Notebook实例通过JupyterLab在线使用Notebook实例进行AI开发通过PyCharm远程使用Notebook实例通过VS Code远程使用Notebook实例通过SSH工具远程使用Notebook

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
创建模型 - AI开发平台ModelArts
创建模型 - AI开发平台ModelArts

创建模型创建模型不同方式的场景介绍从训练作业中导入模型文件创建模型从OBS中导入模型文件创建模型从容器镜像中导入模型文件创建模型从AI Gallery订阅模型父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
推理精度测试 - AI开发平台ModelArts

推理精度测试本章节介绍如何使用lm-eval工具开展语言模型的推理精度测试，数据集包含mmlu、ARC_Challenge、GSM_8k、Hellaswag、Winogrande、TruthfulQA等。约束限制确保容器可以访问公网。当前的精度测试仅适用于语言模型精度验证

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
制作自定义镜像用于创建Notebook - AI开发平台ModelArts

制作自定义镜像用于创建Notebook Notebook的自定义镜像制作方法在ECS上构建自定义镜像并在Notebook中使用在Notebook中通过Dockerfile从0制作自定义镜像在Notebook中通过镜像保存功能制作自定义镜像父主题：制作自定义镜像用于ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
超过最大递归深度导致训练作业失败 - AI开发平台ModelArts

超过最大递归深度导致训练作业失败问题现象 ModelArts训练作业报错： RuntimeError: maximum recursion depth exceeded in __instancecheck__ 原因分析递归深度超过了Python默认的递归深度，导致训练失败。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
创建并管理工作空间 - AI开发平台ModelArts

创建并管理工作空间工作空间是白名单功能，如果有试用需求，请提工单申请权限。背景信息 ModelArts的用户需要为不同的业务目标开发算法、管理和部署模型，此时可以创建多个工作空间，把不同应用开发过程的输出内容划分到不同工作空间中，便于管理和使用。基于工作空间可以实现资源逻辑

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
pipeline应用准备 - AI开发平台ModelArts

pipeline应用准备当前迁移路径是从ONNX模型转换到MindIR模型，再用MindSpore Lite做推理，所以迁移前需要用户先准备好自己的ONNX pipeline。下文以官方开源的图生图的Stable Diffusion v1.5的onnx pipeline代码为例进行说明。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
日志提示“Out of bounds nanosecond timestamp” - AI开发平台ModelArts

日志提示“Out of bounds nanosecond timestamp” 问题现象在使用pandas.to_datetime转换时间时，出现如下报错： pandas._libs.tslibs.np_datetime.OutOfBoundsDatetime: Out of

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
日志文件的大小达到限制 - AI开发平台ModelArts

日志文件的大小达到限制问题现象 ModelArts训练作业在运行过程中报错，提示日志文件的大小已达到限制： modelarts-pope: log length overflow(max:1073741824; already: 107341771; new:90), process

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
创建导入任务 - AI开发平台ModelArts

创建导入任务支持从OBS中导入新的数据，导入方式包括目录导入和Manifest文件导入。 dataset.import_data(path=None, anntation_config=None, **kwargs) 不同类型的数据集支持的导入方式如表1所示。表1 不同数据集支持的导入方式

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 导入任务管理
使用预置算法训练时，训练失败，报“bndbox”错误 - AI开发平台ModelArts

使用预置算法训练时，训练失败，报“bndbox”错误问题现象使用预置算法创建训练作业，训练失败，日志中出现如下报错。 KeyError: 'bndbox' 原因分析用于训练的数据集中，使用了“非矩形框”标注。而预置使用算法不支持“非矩形框”标注的数据集。处理方法此问题有两种解决方法：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
服务部署 - AI开发平台ModelArts
服务部署 - AI开发平台ModelArts

服务部署自定义镜像模型部署为在线服务时出现异常部署的在线服务状态为告警服务启动失败服务部署、启动、升级和修改时，拉取镜像失败如何处理？服务部署、启动、升级和修改时，镜像不断重启如何处理？服务部署、启动、升级和修改时，容器健康检查失败如何处理？服务部署、启动、升级和修改时，资源不足如何处理？

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
训练作业运行失败 - AI开发平台ModelArts

训练作业运行失败训练作业运行失败排查指导训练作业运行失败，出现NCCL报错自定义镜像训练作业失败定位思路使用自定义镜像创建的训练作业一直处于运行中使用自定义镜像创建训练作业找不到启动文件训练作业的监控内存指标持续升高直至作业失败订阅算法物体检测YOLOv3_ResN

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

准备资源创建专属资源池本文档中的模型运行环境是ModelArts Standard，用户需要购买专属资源池，具体步骤请参考创建资源池。资源规格要求：计算规格：用户可参考表1。硬盘空间：至少200GB。昇腾资源规格： Ascend: 1*ascend-snt9b表示昇腾单卡。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
训练作业性能降低 - AI开发平台ModelArts

训练作业性能降低问题现象使用ModelArts平台训练算法训练耗时增加。原因分析可能存在如下原因：平台上的代码经过修改优化、训练参数有过变更。训练的GPU硬件工作出现异常。处理方法请您对作业代码进行排查分析，确认是否对训练代码和参数进行过修改。检查资源分配情况（

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业性能问题
创建标注任务 - AI开发平台ModelArts

创建标注任务基于数据集创建标注任务。 dataset.create_label_task(self, task_name=None, task_type=None, **kwargs) 示例代码示例一：基于图像类型的数据集创建物体检测标注任务。 from modelarts.session

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 标注任务管理

总条数： 2186

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练脚本说明 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

查找Notebook实例 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

使用Notebook进行AI开发调试 - AI开发平台ModelArts

创建模型 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

制作自定义镜像用于创建Notebook - AI开发平台ModelArts

超过最大递归深度导致训练作业失败 - AI开发平台ModelArts

创建并管理工作空间 - AI开发平台ModelArts

pipeline应用准备 - AI开发平台ModelArts

日志提示“Out of bounds nanosecond timestamp” - AI开发平台ModelArts

日志文件的大小达到限制 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

使用预置算法训练时，训练失败，报“bndbox”错误 - AI开发平台ModelArts

服务部署 - AI开发平台ModelArts

训练作业运行失败 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

训练作业性能降低 - AI开发平台ModelArts

创建标注任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线