搜索_华为云

日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

桶中的对象不存在，请检查OBS路径中的内容是否存在。具体错误码请参见OBS官方文档。处理方法检查OBS路径及内容格式是否正常。必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

参数填写完成后，单击“提交”，根据界面提示确认规格，单击“确定”，完成训练作业创建。进入“训练管理 > 训练作业”页面，等待训练作业完成。训练作业运行需要几分钟时间，请耐心等待。根据经验，选择样例数据集，使用GPU资源运行，预计3分钟左右可完成。当训练作业的状态变更为“已完成”时，表示已运行结束。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
在ModelArts中如何查看OBS目录下的所有文件？ - AI开发平台ModelArts

mox.file.list_directory('obs://bucket_name', recursive=True) 如果文件较多，请您耐心等待，最终文件路径信息会在提示信息之后显示。父主题：存储相关

 帮助中心 > AI开发平台ModelArts > 常见问题 > 存储相关
预训练任务 - AI开发平台ModelArts

etrain_13b.sh localhost 1 0 等待模型载入执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入更多查看训练日志和性能操作，请参考查看日志和性能章节。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

#安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 准备工作
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

推理业务迁移到昇腾的通用流程，可参考GPU推理业务迁移至昇腾的通用指导。由于Huggingface网站的限制，访问Stable Diffusion链接时需使用代理服务器，否则可能无法访问网站。在Stable Diffusion迁移适配时，更多的时候是在适配Diffusers和Stable Diffusion

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

#安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字相关文档和本文档配套的模型训练文档请参考《主流开源大模型基于Lite

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
Lite Cluster资源开通 - AI开发平台ModelArts

在服务配额页面，单击右上角的“申请扩大配额”，填写申请材料后提交工单。申请扩大配额主要是申请弹性云服务器ECS实例数、核心数（CPU核数）、RAM容量（内存大小）和云硬盘EVS磁盘容量这4个资源配额。具体的配额数量请先联系客户经理获取。图7 ECS资源类型图8 云硬盘资源类型配额需大于需要开通的资源，且在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
训练图像分类模型 - AI开发平台ModelArts

参考标注图像分类数据章节，确保您的数据已全部完成标注。在新版自动学习页面，单击数据标注节点的“继续运行”按钮，然后等待工作流按顺序进入训练节点即可。模型将会自动进入训练，无需人工介入，训练时间相对较长，建议您耐心等待。如果关闭或退出此页面，系统仍然在执行训练操作。在“图像分类”节点中，待训练状态由“运

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

#安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字相关文档和本文档配套的模型训练文档请参考《主流开源大模型基于Lite

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 准备工作
通过运行的实例保存成容器镜像 - AI开发平台ModelArts

镜像支持的服务。枚举值如下： NOTEBOOK：镜像支持通过https协议访问Notebook。 SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。 id String 待创建Notebook实例的镜像，需要指定镜像ID，ID格式为通用唯一识别码（Universally

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

Turbo的“云上挂载路径”为“/home/ma-user/work”，使得训练环境下SFS也在“/home/ma-user/work”路径下。 ln -s建立软连接如果代码中涉及文件绝对路径，由于Notebook调试与训练作业环境不同，可能会导致文件绝对路径不一致，需要修改代码内容。推荐使用软链接的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
推理精度测试 - AI开发平台ModelArts

├──install.sh #安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字 ├──vllm_ppl.py #ppl精度测试脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
精度调优前准备工作 - AI开发平台ModelArts

型训练成为可能。张量并行不会增加设备等待时间，除了通信代价外，没有额外代价。 PP：流水线并行将模型的不同层放置到不同的计算设备，降低单个计算设备的显存消耗，从而实现超大规模模型训练。流水线并行也叫层间并行，层输入输出的依赖性使得设备需要等待前一步的输出，通过batch进一步切分成微batch，

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
准备镜像环境 - AI开发平台ModelArts

安装，说明机器操作系统安装错误。需要重新纳管机器，重新安装操作系统。安装nerdctl工具。nerdctl是containerd的一个客户端命令行工具，使用方式和docker命令基本一致，可用于后续镜像构建步骤中。 # 下载 nerdctl 工具，注意使用的是1.7.6 arm64版本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
新建Workflow Execution - AI开发平台ModelArts

String 实例ID。 status 否 String 节点的状态。枚举值如下： init：初始化 wait_inputs：等待输入 pending：等待 creating：创建中 created：创建成功 create_failed：创建失败 running：运行中 stopping：停止中

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
预训练任务 - AI开发平台ModelArts

etrain_13b.sh localhost 1 0 等待模型载入执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入训练完成后，生成的权重文件保存路径为：/home/m

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906）
日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

permute(0, 3, 1, 2).contigous()) 将版本回退至pytorch1.3。必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
在ModelArts中使用自定义镜像创建在线服务，如何修改端口？ - AI开发平台ModelArts

从容器镜像中选择”，选择自定义镜像；配置“容器调用接口”和端口号，端口号与模型配置文件中的端口保持一致；设置完成后，单击“立即创建”，等待模型状态变为“正常”；重新部署在线服务。父主题： Standard推理部署

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
准备镜像环境 - AI开发平台ModelArts

安装，说明机器操作系统安装错误。需要重新纳管机器，重新安装操作系统。安装nerdctl工具。nerdctl是containerd的一个客户端命令行工具，使用方式和docker命令基本一致，可用于后续镜像构建步骤中。 # 下载 nerdctl 工具，注意使用的是1.7.6 arm64版本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作

总条数： 878

上一页
1
...
27
28
29
...
44
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

日志提示“errorMessage:The specified key does not exist” - AI开发平台ModelArts

使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

在ModelArts中如何查看OBS目录下的所有文件？ - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

训练图像分类模型 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

通过运行的实例保存成容器镜像 - AI开发平台ModelArts

如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

精度调优前准备工作 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

在ModelArts中使用自定义镜像创建在线服务，如何修改端口？ - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线